UD Russian Taiga
Language: Russian (code: ru
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.2 release.
The following people have contributed to making this treebank part of UD: Olga Lyashevskaya, Olga Rudina, Natalia Vlasova, Anna Zhuravleva.
Repository: UD_Russian-Taiga
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: blog, fiction, news, poetry, social, wiki
Questions, comments? General annotation questions (either Russian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [olesar (æt) yandex • ru]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
Universal Dependencies treebank is based on data samples extracted from Taiga Corpus and MorphoRuEval-2017 and GramEval-2020 shared tasks collections.
UD Russian Taiga has been developed at the School of Linguistics, National Research University Higher School of Economics in Moscow (HSE/Vyshka). The selection of texts is meant to represent those registers that have not been covered by UD Russian SynTagRus and UD Russian Google Stanford Dependencies, mainly e-communication (blogs and social media). The sentences are extracted from two open data collections. Taiga Corpus (https://tatianashavrina.github.io/taiga_site/) is an open-source corpus for machine learning collected by students as part of the curriculum of the MA Program in Computational Linguistics at HSE. MorphoRuEval 2017 text collections (https://github.com/dialogue-evaluation/morphoRuEval-2017) is an output of the RuEval shared task ‘Evaluation of Russian NLP: Morphological analysis, http://www.dialog-21.ru/en/evaluation/2017/morphology/). GramEval 2020 collection (https://competitions.codalab.org/competitions/22902)[https://competitions.codalab.org/competitions/22902] is an output of the GramEval 2020 Shared Task on Russian Full Morphology and Dependency Parsing which consists of test data for five genres (social, wiki, news, fiction, poetry).
The plain text data were tokenized, lemmatized and parsed using UDpipe (http://ufal.mff.cuni.cz/udpipe) and checked manually. Corrections were made at all levels: tokenization, lemmata, pos, features, dependency relations.
Acknowledgments
We are grateful to all the contributors to the original open Russian data collections and especially to Tatiana Shavrina (Taiga, GramEval-2020) and Alena Fenogenova (MorphoRuEval-2017).
References
-
Lyashevskaya, Olga, Kira Droganova, Daniel Zeman, Maria Alexeeva, Tatiana Gavrilova, Nina Mustafina, and Elena Shakurova. (2016). Universal Dependencies for Russian: a New Syntactic Dependencies Tagset. In: Series: Linguistics, WP BRP 44/LNG/2016. Moscow.
-
Sorokin, Andrey, Tatiana Shavrina, Olga Lyashevskaya, Victor Bocharov, Svetlana Alexeeva, Kira Droganova, Alena Fenogenova, and Dmitry Granovsky. (2017). MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian. In Computational Linguistics and Intellectual Technologies, Proceedings of Dialog 2017, Moscow. No 16 (23). Vol. 1, 297-313.
-
Lyashevskaya, Olga, Victor Bocharov, Alexey Sorokin, Tatiana Shavrina, Dmitry Granovsky, and Svetlana Alexeeva. (2017). Text collections for evaluation of Russian morphological taggers. Jazykovedny Casopis, 68 (2), 2017: 258-267.
-
Shavrina, Tatiana, Olga Shapovalova. (2017) To the methodology of corpus construction for machine learning: «Taiga» syntax tree corpus and parser. In Proceedings of the International Conference “CORPORA 2017”, Saint-Petersbourg, Russia.
Statistics of UD Russian Taiga
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – Animacy – Aspect – Case – Degree – Foreign – Gender – Mood – NameType – Number – NumForm – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – Typo – Variant – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:outer – csubj:pass – dep – det – discourse – dislocated – expl – fixed – flat – flat:foreign – flat:name – goeswith – iobj – list – mark – nmod – nsubj – nsubj:outer – nsubj:pass – nummod – nummod:entity – nummod:gov – obj – obl – obl:agent – obl:tmod – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 17872 sentences and 197001 tokens.
- This corpus contains 36286 tokens (18%) that are not followed by a space.
- This corpus contains 3 types of words with spaces. Examples: 10 000, 500 000, 60 000
- This corpus contains 1006 types of words that contain both letters and punctuation. Examples: т., @xxxxxx, что-то, из-за, как-то, д., г., к., кто-то, п., где-то, какие-то, какой-то, с., м., @yabloko, е., н., http://xxxxxx, л., р., А., оч., все-таки, в., чего-то, https://xxxxxx, какая-то, кого-то, чем-то, @Zhirinovskiy, кому-то, тыс., что-нибудь, ООО-очень, и., ил., когда-то, почему-то, руб., ст., ч., Пер., Св., какого-то, какое-то, по-прежнему, P., p.s., какую-то
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 120 word types tagged as particles (PART): -таки, Але, Воот, Д, Даа, Давайте, Идааа, Мож, Неееее, Неужель, Нибудь, Ничего, Пожалуйстаааа, Спасиииибо, ХАЙ, а, ага, аж, ажжжж, аль, буд, будто, бы, было, ведь, во, вон, вот, все, все-таки, всего, всеж, всеже, всё, всё-таки, да, даааа, даже, дай, де, е, еле, ж, же, жеш, зато, здрасте, и, именно, как, конечно, ладно, ли, лии, лиш, лишь, ль, мб, мол, на, не, неее, нет, нето, неужели, ни, норм, нп, ну, пж, пжж, плз, подалуйста, поди, пожалуйста, пожалуйстааа, посквй, прост, просто, прям, прямо, пускай, пусть, разве, с, спасибо, су, супер, таже, так, также, таки, там, те, тже, ти-по, тип, типа, типо, то, тоже, ток, тока, токмо, только, только-только, точно, уж, ужели, ужель, хорошо, хоть, хотя, че, чето, что, что-ли, что-то, это, якобы
- This corpus contains 62 lemmas tagged as pronouns (PRON): вам, весь, всë, все, всё, вы, друг, дружка, еë, ей, кое-кто, кое-что, кой, котоpый, который, кто, кто-либо, кто-нибудь, кто-то, мне, многие, многое, мы, нашатырь, некоторые, некто, нечто, никто, ничeго, ничего, ничо, ничто, он, он+ж, она, они, оно, се, себя, сей, тo, то, то+же, тоже, тот, ты, у+мы, хто, че, че-то, чем, ченить, что, что+бы, что-ли, что-либо, что-нибудь, что-то, эт, это, этот, я
- This corpus contains 57 lemmas tagged as determiners (DET): cвой, eго, ваш, ваша, весь, все, всего, всякий, всё, другой, его, ее, иной, их, каждый, каков, какой, какой-либо, какой-нибудь, какой-то, какую-либо, кое-какой, кой, который, любой, многий, мой, наш, некий, некоторый, никакой, никой, один, одним, она, оный, прочий, с+такой, сам, самый, свой, сей, столький, сякой, так, таков, таковой, такой, твой, то, тот, чей, чей-нибудь, чей-то, чейи-нибудь, это, этот
- Out of the above, 11 lemmas occurred sometimes as PRON and sometimes as DET: весь, все, всё, кой, который, она, сей, то, тот, это, этот
- This corpus contains 3 lemmas tagged as auxiliaries (AUX): б, бы, быть
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: быть
- There are 4 (de)verbal forms:
- Conv
- AUX: будучи
- VERB: говоря, судя, начиная, смотря, учитывая, видя, зная, имея, пытаясь, сидя
- Fin
- AUX: было, был, будет, есть, была, были, будут, буду, будем, будете
- VERB: есть, может, могу, хочу, здравствуйте, стоит, нравится, знаю, подскажите, работает
- Inf
- AUX: быть
- VERB: делать, найти, сделать, купить, быть, сказать, есть, жить, смотреть, посмотреть
- Part
- AUX: бывшая, бывший
- VERB: завышены, написано, исчезнувших, сказано, связано, сделано, приложено, желающих, знающие, представлен
Nominal Features
- Fem
- ADJ: хорошая, вкусная, большая, отличная, удобная, обычная, нужна, должна, новой, большой
- AUX-Fin: была
- AUX-Part: бывшая
- DET: этой, такая, эту, своей, сама, моя, эта, какая, свою, всей
- NOUN: цены, очереди, деньги, правда, жизни, воды, жизнь, парковка, работы, цена
- NUM: две, одной, одна, одну, обеих, двух, обе, двумя, обеим, полторы
- PRON: она, ей, ее, ней, её, которая, нее, неё, которой, которую
- PROPN: россии, Россия, Москве, Ирина, москвы, Катя, Русь, Елена, Надя, Александровна
- VERB-Fin: была, сказала, стала, начала, написала, хотела, могла, решила, понравилась, появилась
- VERB-Part: связана, сделана, завышена, заложена, создана, Восхищена, Построена, Управляющая, включена, госпитализирована
- Masc
- ADJ: хороший, большой, отличный, неплохой, вежливый, обычный, добрый, первый, нужен, красивый
- AUX-Fin: был
- AUX-Part: бывший
- DET: этот, мой, сам, такой, один, каждый, этом, какой, тот, свой
- NOUN: магазин, день, раз, лет, выбор, персонал, года, ассортимент, люди, человек
- NUM: один, два, одного, оба, обоих, одном, полтора, двух, 2-х, Обоим
- PRON: он, кто, его, ему, него, который, ним, никто, кого, которого
- PROPN: Петрович, жириновский, парнас, сочи, Убейд, Генрих, Петровича, крым, Петя, александр
- VERB-Fin: сказал, стал, был, понравился, видел, начал, решил, получил, хотел, мог
- VERB-Part: представлен, организован, построен, потерян, закрыт, занят, открыт, посвящен, расположен, улучшенный
- Neut
- ADJ: нужно, хорошо, хорошее, дорого, вкусно, удобно, удобное, чисто, отличное, интересно
- AUX-Fin: было
- DET: это, такое, все, самое, всё, одно, то, такого, какое, свое
- NOUN: время, место, спасибо, фото, обслуживание, времени, качество, кафе, месте, дело
- NUM: одно, одном, два, одного, одним, оба
- PRON: это, что, все, всё, то, ничего, этого, чем, того, что-то
- PROPN: яблоко, яблока, Девяткино, Сити, Стереолето, авито, Билибино, Внуково, Динамо, Домодедово
- VERB-Fin: было, понравилось, стало, хотелось, получилось, осталось, пришлось, прошло, удалось, оказалось
- VERB-Inf: закончилось
- VERB-Part: написано, сказано, связано, сделано, приложено, принято, закрыто, связанно, вложено, дано
- Anim
- ADJ: второго, младшего, главного, маленьких, мелкого, нового, остальных, прекрасных, 19-летнего, Будущих
- DET: всех, своих, тех, своего, других, этого, другого, этих, моего, того
- NOUN: люди, человек, сотрудники, людей, детей, продавцы, человека, дети, девушка, парень
- NUM: двоих, одного, двух, четверых, 3-х, 5х, нескольких, пятерых, семерых
- PRON: кто, всем, все, никто, всех, кого, кому, кто-то, кем, никому
- PROPN: Петрович, жириновский, Ирина, Генрих, Петровича, Катя, Петя, александр, Елена, Женя
- VERB-Part: желающих, имеющих, вылетающих, жертвующего, живущих, звавшего, курящих, наблюдающий, обвиняемого, обвисшего
- Inan
- ADJ: первый, последний, данный, последние, следующий, новый, второй, хорошие, большой, целый
- DET: этот, все, каждый, эти, свои, свой, любой, мой, такие, весь
- NOUN: магазин, цены, день, раз, время, место, лет, выбор, персонал, года
- NUM: два, один, три, две, четыре, оба, двое, пять, сто, 3е
- PRON: это, что, все, всё, то, ничего, этого, чем, того, что-то
- PROPN: россии, парнас, Россия, сочи, яблоко, Москве, Убейд, москвы, крым, Русь
- VERB-Part: интересующие, просроченные, связанные, собранные, улучшенный, Заглохший, активированый, асфальтированные, бегущий, вложеный
- Plur
- ADJ: хорошие, вежливые, грамотные, доступные, низкие, разных, большие, приемлемые, вкусные, приветливые
- AUX-Fin: были, будут, будем, есть, будете, будьте, будте
- DET: все, эти, всех, такие, какие, других, мои, свои, этих, сами
- NOUN: цены, лет, люди, раз, сотрудники, людей, детей, деньги, товаров, продавцы
- PRON: они, мы, вы, нас, их, вам, них, вас, которые, всем
- PROPN: Сочи, Дзёмог, Известия, Пятерочек, Альфа-банков, Апатит, Афин, Бальмонты, Бернардацци, Блоки
- VERB-Fin: есть, здравствуйте, подскажите, работают, помогите, могут, говорят, сказали, бывают, делают
- VERB-Inf: навязываються
- VERB-Part: завышены, исчезнувших, желающих, знающие, установлены, связаны, выполнены, открыты, погибшим, работающие
- Sing
- ADJ: хороший, большой, нужно, отличный, неплохой, хорошая, хорошо, хорошее, вежливый, обычный
- AUX-Fin: было, был, будет, есть, была, буду, будь, будешь
- AUX-Part: бывшая, бывший
- DET: этот, такой, мой, этой, сам, это, такое, этом, какой, один
- NOUN: магазин, день, время, место, выбор, персонал, раз, ассортимент, года, спасибо
- NUM: один, одной, одна, одного, одном, одно, одну, одним, оден, одному
- PRON: я, это, что, он, мне, меня, все, она, всё, кто
- PROPN: Петрович, россии, жириновский, парнас, Россия, яблоко, Москве, сочи, Ирина, Убейд
- VERB-Fin: есть, может, могу, хочу, стоит, нравится, знаю, работает, сказал, было
- VERB-Inf: закончилось
- VERB-Part: написано, сказано, связано, сделано, приложено, представлен, принято, связана, закрыто, организован
- Acc
- ADJ: первый, последний, данный, последние, следующий, новую, новый, последнее, большую, второй
- DET: этот, все, эту, каждый, это, эти, свои, свой, свою, любой
- NOUN: время, день, раз, деньги, год, пару, работу, жизнь, вкус, месяц
- NUM: несколько, много, сколько, два, один, три, две, одну, столько, пол
- PRON: что, его, меня, это, их, себя, все, ее, всё, то
- PROPN: Русь, крым, россию, сочи, Петровича, Турцию, Украину, Ирак, Китай, госдуму
- VERB-Part: интересующие, просроченные, связанные, желающих, имеющих, связанную, собранные, улучшенный, Заглохший, Рекомендованную
- Dat
- ADJ: крайней, данному, местному, новой, первому, полной, старшему, разным, разумной, советским
- DET: всем, этому, моему, своему, своей, другому, самой, тем, этим, какому
- NOUN: детям, сожалению, людям, поводу, телефону, городу, мере, словам, времени, мнению
- NUM: одной, обоим, 12-ти, 3м, многим, нескольку, обеим, одному, пяти, трём
- PRON: мне, ему, вам, ей, всем, себе, им, нам, тебе, кому
- PROPN: Петровичу, Ирине, Наде, Виктору, Гарри, Интерфаксу, Москве, Пересу, России, Фарингейту
- VERB: погибшим, защищавшим, изложенным, некому, Ведущим, Вспотевшим, Входящим, Понимающим, Предпочитающим, Уносимым
- VERB-Part: погибшим, защищавшим, изложенным, Ведущим, Вспотевшим, Входящим, Понимающим, Предпочитающим, Уносимым, видимым
- Gen
- ADJ: разных, хорошего, первого, лучших, плохого, доброго, лучшего, особенного, различных, советского
- DET: этого, этой, всех, такого, этих, других, никаких, таких, тех, своего
- NOUN: лет, года, раз, дня, воды, города, товаров, людей, времени, детей
- NUM: двух, одного, одной, нескольких, трех, двоих, обоих, пяти, десяти, обеих
- PRON: меня, ничего, этого, нас, того, них, чего, него, всего, вас
- PROPN: россии, москвы, Востока, Петровича, Путина, Госдумы, Украины, жириновского, Крыма, яблока
- VERB: исчезнувших, нечего, желающих, проходящих, сопутствующих, выходящих, заболевших, называемого, некого, обманутых
- VERB-Part: исчезнувших, желающих, проходящих, сопутствующих, выходящих, заболевших, называемого, обманутых, организованных, питающей
- Ins
- ADJ: большим, первым, хорошим, большой, главным, новым, огромным, тяжелым, хорошими, доступными
- DET: таким, своей, этим, своими, такой, всей, другими, своим, каждым, этими
- NOUN: вечером, зимой, летом, ночью, утром, помощью, водой, домом, днем, друзьями
- NUM: двумя, одним, несколькими, одной, пятью, сколькими, тремя, четырьмя, шестью
- PRON: чем, ним, тем, собой, ней, этим, мной, ними, кем, вами
- PROPN: Ириной, Петровичем, Россией, Генрихом, ЗЕТИЛОВЫМ, Зюгановым, Игорем, Михаилом, Петей, Шнидер
- VERB: состоявшимися, вытекающими, закрытыми, оперирующим, Назначенной, Рокочущим, Узаконенными, благоустроенными, бьющейся, верующим
- VERB-Part: состоявшимися, вытекающими, закрытыми, оперирующим, Назначенной, Рокочущим, Узаконенными, благоустроенными, бьющейся, верующим
- Loc
- ADJ: общем, высшем, высоком, основном, втором, новом, первом, хорошем, данном, первых
- DET: этом, том, самом, этой, других, всех, таком, своем, нашем, своих
- NOUN: месте, уровне, году, городе, жизни, случае, целом, итоге, магазинах, центре
- NUM: одном, одной, двух, нескольких, трех, трёх, обоих, 3х, обеих, пяти
- PRON: том, этом, чем, ней, нем, себе, них, котором, чём, которой
- PROPN: россии, Москве, Сочи, крыму, Ираке, Петербурге, Туре, Украине, Питере, Франции
- VERB-Part: закрытой, возглашавших, выделенных, вынужденной, действующем, запомнившемся, заряженной, затерявшемся, затуманенном, написанном
- Nom
- ADJ: хороший, большой, отличный, хорошая, неплохой, вежливый, обычный, хорошее, добрый, вежливые
- AUX-Part: бывшая, бывший
- DET: все, сам, этот, такая, мой, такое, один, такой, сама, моя
- NOUN: магазин, цены, место, выбор, персонал, ассортимент, спасибо, люди, обслуживание, сотрудники
- NUM: много, мало, два, один, сколько, одна, три, две, несколько, немного
- PRON: я, он, это, все, она, что, они, мы, кто, вы
- PROPN: Петрович, жириновский, Россия, яблоко, Ирина, Генрих, Убейд, парнас, Катя, Петя
- VERB-Part: знающие, работающие, сопутствующие, Стоявшие, Управляющая, влекомый, забытый, завышенные, казавшаяся, намоленное
- Par
- NOUN: разу, народу, виду, толку, сраму, чаю, Воску, азу, кофейку, краю
- PRON: чего
- Voc
- NOUN: боже, ребят, господи
- PROPN: Катюнь, Серёж, Тань
Degree and Polarity
- Cmp
- ADJ: лучше, хуже, дешевле, выше, больше, ниже, дороже, старше, ближе, вкуснее
- ADV: раньше, больше, более, скорее, дальше, лучше, далее, чаще, короче, менее
- NUM: больше, побольше, меньше, поболя
- Pos
- ADJ: хороший, большой, нужно, отличный, неплохой, хорошая, хорошо, хорошее, вежливый, обычный
- ADV: очень, уже, так, как, еще, там, ещё, где, часто, вообще
- Sup
- ADJ: лучший, лучших, высшем, лучшая, лучшие, лучшего, лучшее, красивейший, лучшей, лучшем
- ADV: наиболее, наименее
- Neg
- ADV: нихера, Нифига, Нихуя, не
- CCONJ: ни
- PART: не, ни, нет, Неееее, Ничего, на, неее, е, нп
- VERB: нет, нету, нельзя, негде, некуда, нечего, некогда, Несть, не, некого
- Short
- ADJ: нужно, хорошо, дорого, вкусно, удобно, чисто, интересно, нужен, должен, равно
- DET: какова, такова, Каков, о́но, таков
- PRON: те
- VERB-Part: завышены, написано, сказано, связано, сделано, приложено, представлен, принято, установлены, связана
Verbal Features
- Imp
- AUX-Conv: будучи
- AUX-Fin: было, был, есть, была, были
- AUX-Inf: быть
- AUX-Part: бывшая, бывший
- VERB-Conv: говоря, судя, начиная, смотря, учитывая, видя, зная, имея, пытаясь, сидя
- VERB-Fin: есть, может, могу, хочу, здравствуйте, стоит, нравится, знаю, работает, было
- VERB-Inf: делать, быть, есть, жить, смотреть, ходить, пить, работать, ехать, ждать
- VERB-Part: желающих, знающие, работающие, имеющих, интересующие, проходящих, сопутствующие, сопутствующих, Стоявшие, Управляющая
- Perf
- VERB-Conv: выйдя, дождавшись, нахмурясь, оставив, посмотрев, Услышав, выстрелив, дав, доставши, забыв
- VERB-Fin: подскажите, сказал, понравилось, стал, помогите, стало, понравился, сказали, сказала, скажите
- VERB-Inf: найти, сделать, купить, сказать, посмотреть, взять, понять, получить, узнать, обратиться
- VERB-Part: завышены, написано, исчезнувших, сказано, связано, сделано, приложено, представлен, принято, установлены
- Cnd
- AUX: бы, б
- SCONJ: чтобы, чтоб, что, что-бы, шобы, Чтоп
- Imp
- AUX-Fin: будь, будьте, будте
- VERB-Fin: здравствуйте, подскажите, помогите, скажите, посоветуйте, дайте, давай, давайте, объясните, дай
- Ind
- AUX-Fin: было, был, будет, есть, была, были, будут, буду, будем, будете
- VERB-Fin: есть, может, могу, хочу, стоит, нравится, знаю, работает, сказал, было
- VERB-Inf: закончилось, навязываються
- Fut
- AUX-Fin: будет, будут, буду, будем, будете, будешь
- VERB-Fin: помогут, скажу, будет, сможет, подскажут, поможет, придется, хватит, допустим, останется
- Past
- AUX-Fin: было, был, была, были
- AUX-Part: бывшая, бывший
- VERB-Conv: выйдя, дождавшись, нахмурясь, оставив, посмотрев, Услышав, выстрелив, дав, доставши, забыв
- VERB-Fin: сказал, было, понравилось, стал, стало, был, была, понравился, сказали, сказала
- VERB-Inf: закончилось
- VERB-Part: завышены, написано, исчезнувших, сказано, связано, сделано, приложено, представлен, принято, установлены
- Pres
- AUX-Conv: будучи
- AUX-Fin: есть
- VERB-Conv: говоря, судя, начиная, смотря, учитывая, видя, зная, имея, пытаясь, сидя
- VERB-Fin: есть, может, могу, хочу, стоит, нравится, знаю, работает, рекомендую, говорит
- VERB-Inf: навязываються
- VERB-Part: желающих, знающие, работающие, имеющих, интересующие, проходящих, сопутствующие, сопутствующих, Управляющая, бегущий
- Act
- AUX-Conv: будучи
- AUX-Fin: было, был, будет, есть, была, были, будут, буду, будем, будете
- AUX-Inf: быть
- AUX-Part: бывшая, бывший
- VERB-Conv: говоря, судя, начиная, смотря, учитывая, видя, зная, имея, сидя, Глядя
- VERB-Fin: есть, может, могу, хочу, здравствуйте, стоит, знаю, подскажите, работает, сказал
- VERB-Inf: делать, найти, сделать, купить, быть, сказать, есть, жить, смотреть, посмотреть
- VERB-Part: исчезнувших, желающих, знающие, погибшим, работающие, имеющих, интересующие, проходящих, сопутствующие, сопутствующих
- Mid
- VERB-Conv: пытаясь, дождавшись, надеясь, нахмурясь, занимаясь, обернувшись, поднявшись, проснувшись, смеясь, ссылаясь
- VERB-Fin: нравится, понравилось, хочется, находится, кажется, понравился, называется, хотелось, боюсь, получилось
- VERB-Inf: обратиться, общаться, обращаться, встречаться, добраться, заниматься, учиться, вернуться, пользоваться, разобраться
- VERB-Part: относящиеся, светящиеся, возвратившихся, заблудившихся, запоминающиеся, запоминающийся, запомнившемся, затерявшемся, имеющимуся, казавшаяся
- Pass
- VERB-Fin: записывается, отмечается, Вбрасывается, Делается, Использовалось, акцентировалось, воспитываются, вставляется, выводится, выдаются
- VERB-Inf: приниматься
- VERB-Part: завышены, написано, сказано, связано, сделано, приложено, представлен, принято, установлены, связана
Pronouns, Determiners, Quantifiers
- Dem
- ADV: так, там, сейчас, здесь, потом, тут, теперь, туда, тогда, потому
- DET: этот, такой, этой, эти, это, такое, этом, такие, этого, такая
- PRON: это, то, этого, того, том, этом, тем, этим, т., тому
- Emp
- DET: сам, сама, самый, самое, сами, самые, самом, самой, самого, самая
- PRON: Что
- Exc
- ADV: как, чтож
- DET: какая, какие, какой, Какое
- PRON: что
- Ind
- ADV: как-то, как, где-то, когда-то, почему-то, где, когда, когда-нибудь, почему, куда-то
- DET: один, одна, некоторые, одно, какие-то, какой-то, одной, одни, какая-то, какие
- PRON: что-то, что, кто-то, кто, чего-то, кого-то, чем-то, кому-то, что-нибудь, кто-нибудь
- Int
- ADV: как, где, почему, куда, зачем, откуда, когда, что, чего, Почто
- DET: какой, какие, какая, какую, какое, каком, каким, Какого, каких, какому
- PRON: что, кто, чем, кого, чего, кому, чём, че, кем, што
- Neg
- ADV: никогда, никак, нигде, никуда, как, нихера, ничего, причем, Нифига, Нихуя
- DET: никаких, никакой, никакого, каких, никакие, какие, какого, никакую, Никаким, как
- PRON: ничего, никто, никому, никого, чем, ничем, что, кем, ничто, чего
- Prs
- DET: его, мой, их, своей, ее, мои, свой, свои, моя, свою
- PRON: я, он, мне, меня, она, они, мы, его, вы, ты
- Rcp
- PRON: друг, друга, другом, другу, дружку
- Rel
- ADV: как, где, куда, почему, к., когда, зачем, откуда, что, сколько
- DET: какой, какая, какие, какое, какому, каким, каких, каком, какую, какими
- PRON: что, кто, которые, который, чего, чем, которая, которых, которого, которой
- Tot
- ADV: всегда, больше, более, иногда, везде, все, немного, менее, всё, меньше
- DET: все, всех, каждый, других, любой, другой, весь, всем, всей, вся
- PRON: все, всё, всем, всего, всех, многие, многое, всему, всём, всëм
- Card
- NUM: много, 2, 3, 1, 5, несколько, 4, два, один, сколько
- Frac
- ADJ: 1\5
- NUM: пол, 0,5, 1,5, полтора, 2,5, 1.5, 0,25, 4,5, 5,2, 2,2
- Ord
- ADJ: первый, второй, первого, 2, первые, 1, первых, первая, вторая, второго
- Sets
- NUM: оба, двоих, двое, обоих, обеих, трое, обе, обоим, четверых, 2
- Yes
- ADJ: Божией, Божьей, Божьим, Иринины, Петину, Петровичеву, Христова, бабушкин, бычьей, маминой
- DET: его, мой, их, своей, ее, свой, мои, свои, моя, свою
- Yes
- DET: своей, свой, свои, свою, своих, своего, своим, свое, своем, своими
- PRON: себя, себе, собой, собою, cобой
- 1
- AUX-Fin: буду, будем, есть
- PRON: я, мне, меня, мы, нас, нам, мной, нами, мною, на
- VERB-Fin: могу, хочу, знаю, рекомендую, думаю, люблю, понимаю, помню, прошу, боюсь
- 2
- AUX-Fin: будете, будь, будешь, будьте, будте
- PRON: вы, ты, вам, вас, тебя, тебе, вами, тобой, тобою, те
- VERB-Fin: здравствуйте, подскажите, помогите, скажите, можете, посоветуйте, знаете, хотите, дайте, думаете
- 3
- AUX-Fin: будет, есть, будут
- PRON: он, она, они, его, ему, их, них, ей, него, им
- VERB-Fin: есть, может, стоит, нравится, работает, говорит, отвечает, работают, могут, хочется
- VERB-Inf: навязываються
Other Features
- Abbr
- Yes
- ADJ: п., ст., жд, мед., Св., ч., англ., гос., дет., ж/д
- ADP: н, п
- ADV: т., д., оч., к., тд, д, оч, Крч, в/м, к
- DET: др., н., т., др, проч
- INTJ: пздц
- NOUN: тц, г., см, мл, кг, с., р, р., км, м
- NUM: неск, неск.
- PART: пж, плз, мб, пжж
- PRON: т., кот.
- PROPN: сша, ЛДПР, М., СССР, РФ, А., кпрф, спб, В., Н.
- SCONJ: тк, к.
- VERB: е., см., е, и., н., нрав, см, созд
- X: С, хз, п., с., З., П, Соп., ТТГ, Ы., P.
- Yes
- Foreign
- Yes
- ADJ: романтик, стронг, форте
- ADV: мах
- INTJ: Хэллоу
- NOUN: блю, дор, А, U, f, r, Ремо, С, ая, е
- PART: Д, Де, ХАЙ, плз
- PROPN: джо, PS4, М, Эль, тикетс, EF1057, F, G, NS3FB, Алегре
- VERB: МАНДРУЕ
- X: RT, P., p.s., iphone, s, P.S, the, apple, cm, of
- Yes
- NameType
- Com
- PROPN: @yabloko, ЛДПР, парнас, яблоко, кпрф, @YouTube, Наука, ЕР, Госдумы, вк
- Geo
- PROPN: россии, сша, Россия, сочи, СССР, Москве, РФ, Убейд, москвы, М.
- Giv
- PROPN: Ирина, Генрих, Катя, Петя, александр, Елена, Женя, Надя, андрей, А.
- Oth
- PROPN: E, М, Стереолето, Хаджи-Мухаммед, инете, 0А, АА, АВ, Гелиодор, Н-209
- Pat
- PROPN: Александровна, Владимировна, А., Дмитриевич, Анатольевна, В., С., Владимирович, И., Леонидович
- Pro
- PROPN: инсте, 1000д, 90пц10, PS4, А5, Запорожца, К, КАМАЗа, ПЦР, бат
- Prs
- PROPN: @xxxxxx, Петрович, @Zhirinovskiy, Петровича, @screened-200, Петровичу, жирик, @screened-18, @screened-134, @screened-15
- Sur
- PROPN: жириновский, жириновского, Путина, Леонов, Явлинский, путин, Петров, Тихонов, Александров, Бернардацци
- Zoo
- PROPN: полкан, Волк, Волка, Граф, Лев
- Com
- NumForm
- Combi
- ADJ: 90-е, 90-х, 1997-м, 1й, 2й, 70-х, 80-х, 1-го, 1-ом, 1-х
- NUM: 2-х, 3-х, 3х, 11-ти, 12-ти, 13-ти, 18-ти, 20-ти, 2х, 30-ти
- Digit
- ADJ: 2, 1, 3, 2020, 12, 2013, 2015, 2017, 18, 2012
- NUM: 2, 3, 1, 5, 4, 10, 7, 30, 6, 20
- Roman
- ADJ: II, IV, V, VI, XIV, XVI, XX
- NUM: I
- Word
- ADJ: первый, второй, первого, первые, первых, первая, вторая, второго, первую, втором
- NUM: много, несколько, два, один, сколько, три, мало, две, больше, двух
- Combi
- Typo
- Yes
- ADJ: СУППЕР, Хорошое, компитентный, не, хорошии, экстро, 2, Александовской, Анти, Бондарчуковския
- ADP: а, из, и, на, в, К, Ут, восле, заа, иза
- ADV: как, где, когда, почему, сдесь, не, что, вобще, както, по
- AUX-Fin: будте
- CCONJ: Так, Иди, ин, лбо, нр
- DET: какие, какой, какая, какого, какое, какую, это, всё, дургие, как
- INTJ: бл@, бляь, да
- NOUN: ге, атракционов, бриджы, дело, линолиум, мороженное, тысеч, удаленьщики, #кайтсефринг, Аоезда
- NUM: з, не, оден, скольки
- PART: все, Да, Даааа, Спасиииибо, буд, лии, лиш, прямо, е, не
- PRON: что, кто, чем, кем, кого, ни, сто, Нечего, Тоже, клторые
- PROPN: Фарингейту, инстаграм, инстаграмме, телеграмме, @screened-212, Акропле, Анндрей, Беклемищева, В, Вкус
- SCONJ: что, чтл, я, Чтоп
- VERB: нравиться, Если, Здраствуйте, находиться, связанно, бежив, встретится, держут, ложиться, любить
- VERB-Conv: Каснувшись, имтируя, подьезжая
- VERB-Fin: нравиться, Здраствуйте, находиться, бежив, держут, ложиться, любить, приходиться, Быди, Взязи
- VERB-Inf: встретится, ПОДКЛЧИТЬ, беспокоит, в, взабраться, видится, восонавить, выбратся, выветритьсч, выглядываться
- VERB-Part: связанно, Оперируюший, Представленны, Уничножен, ШПредставлен, випитого, вложеный, внесет, запрещённа, заслам
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: быть, это.
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: бы, быть, б.
- This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: быть.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--NOUN-Gen (247)
- VERB--NOUN-Ins (1)
- VERB--NOUN-Nom (28)
- VERB--PRON-Gen (32)
- VERB--PRON-Nom (20)
- VERB-Conv--NOUN-Nom (3)
- VERB-Fin--NOUN (24)
- VERB-Fin--NOUN-ADP(после) (1)
- VERB-Fin--NOUN-Acc (2)
- VERB-Fin--NOUN-Gen (209)
- VERB-Fin--NOUN-Gen-ADP(до) (1)
- VERB-Fin--NOUN-Gen-ADP(около) (2)
- VERB-Fin--NOUN-Gen-ADP(порядок) (1)
- VERB-Fin--NOUN-Loc-ADP(в) (1)
- VERB-Fin--NOUN-Nom (4232)
- VERB-Fin--NOUN-Nom-ADP(в) (1)
- VERB-Fin--NOUN-Nom-ADP(за) (3)
- VERB-Fin--NOUN-Nom-ADP(как) (2)
- VERB-Fin--NOUN-Nom-ADP(с) (1)
- VERB-Fin--NOUN-Nom-ADP(спустя) (1)
- VERB-Fin--NOUN-Par (2)
- VERB-Fin--PRON-Dat (1)
- VERB-Fin--PRON-Gen (52)
- VERB-Fin--PRON-Nom (3490)
- VERB-Fin--PRON-Nom-ADP(плюс) (1)
- VERB-Inf--NOUN-Gen (4)
- VERB-Inf--NOUN-Nom (61)
- VERB-Inf--PRON-Gen (1)
- VERB-Inf--PRON-Nom (59)
- VERB-Part--NOUN-Gen (2)
- VERB-Part--NOUN-Nom (38)
- VERB-Part--PRON-Nom (11)
- obj
- VERB--NOUN-Acc (11)
- VERB--NOUN-Gen (8)
- VERB--PRON-Acc (5)
- VERB--PRON-Gen (3)
- VERB--PRON-Par (1)
- VERB-Conv--NOUN-Acc (138)
- VERB-Conv--NOUN-Dat (1)
- VERB-Conv--NOUN-Gen (22)
- VERB-Conv--NOUN-Ins (6)
- VERB-Conv--PRON-Acc (20)
- VERB-Conv--PRON-Nom (1)
- VERB-Fin--NOUN (23)
- VERB-Fin--NOUN-Acc (2735)
- VERB-Fin--NOUN-Acc-ADP(в) (2)
- VERB-Fin--NOUN-Acc-ADP(из) (1)
- VERB-Fin--NOUN-Acc-ADP(к) (1)
- VERB-Fin--NOUN-Acc-ADP(на) (1)
- VERB-Fin--NOUN-Acc-ADP(от) (2)
- VERB-Fin--NOUN-Acc-ADP(по) (2)
- VERB-Fin--NOUN-Acc-ADP(типа) (1)
- VERB-Fin--NOUN-Dat (10)
- VERB-Fin--NOUN-Dat-ADP(по) (2)
- VERB-Fin--NOUN-Gen (344)
- VERB-Fin--NOUN-Gen-ADP(до) (1)
- VERB-Fin--NOUN-Gen-ADP(из) (1)
- VERB-Fin--NOUN-Gen-ADP(около) (1)
- VERB-Fin--NOUN-Gen-ADP(по) (3)
- VERB-Fin--NOUN-Ins (31)
- VERB-Fin--NOUN-Loc (1)
- VERB-Fin--NOUN-Nom (6)
- VERB-Fin--NOUN-Par (5)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (944)
- VERB-Fin--PRON-Acc-ADP(в) (1)
- VERB-Fin--PRON-Dat (3)
- VERB-Fin--PRON-Gen (84)
- VERB-Fin--PRON-Ins (7)
- VERB-Fin--PRON-Nom (5)
- VERB-Inf--NOUN (18)
- VERB-Inf--NOUN-Acc (1438)
- VERB-Inf--NOUN-Acc-ADP(на) (1)
- VERB-Inf--NOUN-Dat (1)
- VERB-Inf--NOUN-Dat-ADP(по) (1)
- VERB-Inf--NOUN-Gen (107)
- VERB-Inf--NOUN-Gen-ADP(по) (1)
- VERB-Inf--NOUN-Gen-ADP(порядка) (1)
- VERB-Inf--NOUN-Gen-ADP(у) (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--NOUN-Par (2)
- VERB-Inf--PRON-Acc (521)
- VERB-Inf--PRON-Gen (41)
- VERB-Inf--PRON-Ins (1)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN-Acc (80)
- VERB-Part--NOUN-Dat (2)
- VERB-Part--NOUN-Gen (6)
- VERB-Part--NOUN-Ins (2)
- VERB-Part--PRON-Acc (2)
- iobj
- VERB--NOUN-Dat (11)
- VERB--NOUN-Ins (2)
- VERB--PRON-Dat (49)
- VERB--PRON-Ins (1)
- VERB-Conv--NOUN-Dat (9)
- VERB-Conv--NOUN-Ins (29)
- VERB-Conv--NOUN-Ins-ADP(от) (1)
- VERB-Conv--NOUN-Ins-ADP(со) (1)
- VERB-Conv--PRON-Dat (6)
- VERB-Conv--PRON-Ins (5)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Dat (238)
- VERB-Fin--NOUN-Dat-ADP(в) (1)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Ins (291)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Dat (725)
- VERB-Fin--PRON-Ins (41)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN (3)
- VERB-Inf--NOUN-Dat (79)
- VERB-Inf--NOUN-Dat-ADP(к) (1)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Ins (104)
- VERB-Inf--PRON-Dat (171)
- VERB-Inf--PRON-Ins (36)
- VERB-Part--NOUN-Dat (12)
- VERB-Part--NOUN-Ins (62)
- VERB-Part--PRON-Dat (17)
- VERB-Part--PRON-Ins (4)
Verbs with Reflexive Core Objects
- This corpus contains 102 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: вести себя, чувствовать себя, купить себе, представлять собой, беречь себя, забрать себе, зарекомендовать себя, контролировать себя, кормить себя, найти себе, ограничить себя, побаловать себя, подобрать себе, позволять себе, почесать себя, почувствовать себя, баловать себя, бурчать себе, вернуть себе, взять себе, взять себя, вить себя, владеть собой, владеть собою, внушать себе, возомнить себя, выбрать себе, выдавать себя, говорить себе, дать свой, дать себе, делать себе, дурачить себя, есть себя, ждать себя, жеpтвовать cобой, жить себе, забыть свои, завести себе, задавать себе, занять себя, заполнять собою, заставить себя, заставлять себя, засыпать свой, звать себя, знаменовать собой, изменять себя, иметь себя, искать себе
- Out of those, 1 lemmas occurred more than once, but never without a reflexive dependent. Examples: зарекомендовать
Relations Overview
- This corpus uses 12 relation subtypes: acl:relcl, aux:pass, csubj:outer, csubj:pass, flat:foreign, flat:name, nsubj:outer, nsubj:pass, nummod:entity, nummod:gov, obl:agent, obl:tmod
- The following 1 relation types are not used in this corpus at all: clf