Treebank Statistics: UD_Buryat-BDT: Features: Case
This feature is universal.
It occurs with 6 different values: Abl
, Acc
, Com
, Dat
, Gen
, Nom
.
4058 tokens (40%) have a non-empty value of Case
.
2334 types (57%) occur at least once with a non-empty value of Case
.
1351 lemmas (55%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (2950; 29% instances), PROPN (700; 7% instances), PRON (260; 3% instances), VERB (121; 1% instances), NUM (9; 0% instances), ADJ (8; 0% instances), AUX (6; 0% instances), ADV (4; 0% instances).
NOUN
2950 NOUN tokens (95% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=EMPTY (2586; 88%).
NOUN
tokens may have the following values of Case
:
Abl
(67; 2% of non-emptyCase
): нютагһаа, наһанһаа, онһоо, утаһаар, багаһаа, зүрхэнһөө, сагһаа, хотоһоо, үндэһэнһөө, һууринһааAcc
(130; 4% of non-emptyCase
): бэеэ, зааниие, хүниие, зониие, поэзии, хүбүүе, үхибүүниинь, үхибүүдые, Сэхыень, арадуудыеCom
(90; 3% of non-emptyCase
): хэрэгтэй, наһатай, бэлигтэй, соёлтой, шадабаритай, артистнартай, нэрэтэй, түүхэтэй, удхатай, үхибүүтэйDat
(393; 13% of non-emptyCase
): үедэ, ондо, нютагта, хотодо, һургуулида, туршада, хүндэ, сагта, жэлдэ, гэртээGen
(529; 18% of non-emptyCase
): аймагай, соёлой, жэлэй, театрай, хэлэнэй, хүнэй, һургуулиин, зоной, нютагай, буряадайNom
(1741; 59% of non-emptyCase
): хүн, зон, гэр, хэлэ, ажал, хэлэн, Буряад, бэлиг, нютаг, соёлEMPTY
(162): түмэр, угаараа, хэлээр, аймагаар, багшаар, барилдаагаар, дүнгүүдээр, замаар, машинаар, наһаараа
Paradigm нютаг | Nom | Acc | Dat | Gen | Com | Abl |
---|---|---|---|---|---|---|
_ | нютаг, нютагни | нютагта, нютагтамнай | нютагай, нютагайхид | нютагтай | нютагһаа | |
Number=Plur | нютагууд | |||||
Number[psor]=Sing|Person[psor]=3 | нютагтань | нютагайнь | ||||
Reflex=Yes | нютагаа | нютагые | нютагтаа | нютагайнгаа |
PROPN
700 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Case
.
PROPN
tokens may have the following values of Case
:
Abl
(9; 1% of non-emptyCase
): Монголһоо, Алташаһаа, Зандинһаа, Суулгаһаа, Хаашагһаа, Дулмаһаа, Оулуһаань, ТуркуһааньAcc
(5; 1% of non-emptyCase
): Зандиниие, Тамминэни, Шанагаяа, Цыпелмаае, ЦыренгармаевыеCom
(7; 1% of non-emptyCase
): Борисовтай, Далбаевтай, Ивановтой, Митрошкинатай, Протасоватай, Ханхареевнатай, ЦыреноватайDat
(24; 3% of non-emptyCase
): Улаан-Үдэдэ, Зандинда, Абида, Баянгазада, Голливудта, Москвадашье, Париста, Суулгада, Туркада, Усть-ОрдадаGen
(138; 20% of non-emptyCase
): Россиин, Агын, СССР-эй, Усть-Ордын, Азиин, Ивалгын, Монголой, Сибириин, Суулгын, ТүнхэнэйNom
(517; 74% of non-emptyCase
): Байгал, Энэдхэг, Хойто, Булад, Улаан-Үдэ, Баянгаза, Цыпелма, Баяр, Зүдхэлиин, ЗүүнEMPTY
(9): Мундаргын, Абагал, Гүрэнэй, Кондратьев, Кондратьевай, Хатареев, Хүсөөтэдэ, Шишкинские
Paradigm Цыпелма | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Цыпелма | Цыпелмаае | Цыпелмада | Цыпелмагай | |
Reflex=Yes | Цыпелмае |
PRON
260 PRON tokens (90% of all PRON
tokens) have a non-empty value of Case
.
PRON
tokens may have the following values of Case
:
Abl
(4; 2% of non-emptyCase
): Бултанайнгаа, Тэрээнһээ, бусадһаа, энэһээAcc
(21; 8% of non-emptyCase
): бүгэдые, бүхэниие, маанарые, тэрэниие, энээниие, Өөһэнөө, Хамагые, Энээхэниие, бултанииемнай, бултыемнайCom
(5; 2% of non-emptyCase
): шамтай, Намтаяа, тэдээнтэй, тэрэнтэйDat
(23; 9% of non-emptyCase
): намда, бүхэндэ, Маанадта, Шамда, Энээндэнь, бидэнтэеэ, бултадаа, маанарта, танда, тэдээндэGen
(77; 30% of non-emptyCase
): минии, манай, намайе, тэрэнэй, өөрынгөө, Тэдэнэй, өөрын, бидэнэй, танай, өөһэдынNom
(130; 50% of non-emptyCase
): би, бидэ, эдэ, тэрэ, энэшни, энэ, өөрөө, та, тэдэнэр, тэрэшниEMPTY
(28): нэгэниинь, тэдэнээ, хэншье, хэнэй, юугээрээ, юунһээшье, Намааршье, Хэнэйшье, Юугээ, алииеньшье
Paradigm тэрэ | Nom | Acc | Dat | Gen | Com | Abl |
---|---|---|---|---|---|---|
Number[psor]=Sing|Person[psor]=3 | тэрээндэнь | |||||
тэрэ, тэрэшни, тэрээн, тэрэмни | тэрэниие, тэрээниие | тэрээндэ | тэрэнэй | тэрэнтэй | Тэрээнһээ |
VERB
121 VERB tokens (8% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Mood=EMPTY (121; 100%), Person=EMPTY (121; 100%), Number=EMPTY (119; 98%), VerbForm=Ger (118; 98%), Tense=EMPTY (116; 96%).
VERB
tokens may have the following values of Case
:
Abl
(2; 2% of non-emptyCase
): барихаһаа, табихаһааAcc
(20; 17% of non-emptyCase
): байхаяа, бэдэрхэеэ, бэелүүлхэеэ, бүтээхэеэ, долгилхые, орилхыень, орохыень, сахихаяа, туһалхые, тэжээхэеэDat
(63; 52% of non-emptyCase
): гэхэдэ, байхада, ошоходоо, хэлэхэдэ, байхадаа, ерэхэдэнь, ерэхэдээ, харахада, хүдэлхэдөө, эхилхэдэньGen
(7; 6% of non-emptyCase
): болохынь, бэелүүлхын, түрэһэнэй, шэлэхын, эзэлхын, ябахын, һурахынNom
(29; 24% of non-emptyCase
): ерэхэб, болохоб, ошохоб, һанагшаб, Ошохоо, ажаллагшад, байхаш, байһанаа, барихаш, болохошEMPTY
(1409): гэжэ, бии, байгаа, бэлэй, гээшэ, ажаһуудаг, эхилээ, ябаа, байна, ерээ
Paradigm һура | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Reflex=Yes | һурахадаа | |||
һурахаш | һурахаяа | һурахадатнай | һурахын |
NUM
9 NUM tokens (4% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (9; 100%).
NUM
tokens may have the following values of Case
:
Acc
(1; 11% of non-emptyCase
): нэгыеNom
(8; 89% of non-emptyCase
): гурбадахи, нэгэдэхи, Хоёрдохи, арбадахи, хоердохи, юһэдэхиEMPTY
(214): нэгэ, зуун, хоёр, арбан, гурбан, юһэн, долоон, мянга, хоер, 1-дэхи
Paradigm нэгэ | Nom | Acc |
---|---|---|
нэгэдэхи | нэгые |
ADJ
8 ADJ tokens (1% of all ADJ
tokens) have a non-empty value of Case
.
ADJ
tokens may have the following values of Case
:
Acc
(2; 25% of non-emptyCase
): хатууе, зориһоныеCom
(4; 50% of non-emptyCase
): муутай, хурсатай, хэрэгтэй, шогтойGen
(1; 13% of non-emptyCase
): ГорскогоNom
(1; 13% of non-emptyCase
): һайнуудEMPTY
(806): буряад, түрэл, уран, олон, һайн, бага, үндэр, бэрхэ, агууехэ, гоё
AUX
6 AUX tokens (3% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Aspect=EMPTY (6; 100%), Mood=EMPTY (6; 100%), Number=EMPTY (6; 100%), Person=EMPTY (6; 100%), Tense=EMPTY (6; 100%), VerbForm=Ger (6; 100%).
AUX
tokens may have the following values of Case
:
Abl
(1; 17% of non-emptyCase
): байхаһааDat
(4; 67% of non-emptyCase
): байхада, байхадааNom
(1; 17% of non-emptyCase
): байхалEMPTY
(187): байгаа, байна, байһан, болоно, бай, болоо, байгааб, байба, байдаг, болонхой
Paradigm бай | Nom | Dat | Abl |
---|---|---|---|
Reflex=Yes | байхадаа | ||
байхал | байхада | байхаһаа |
ADV
4 ADV tokens (1% of all ADV
tokens) have a non-empty value of Case
.
ADV
tokens may have the following values of Case
:
Nom
(4; 100% of non-emptyCase
): тэндэхи, хаанахиEMPTY
(772): ехэ, мүнөө, гэһэн, бэшэ, һайхан, эндэ, эгээл, хадаа, үшөө, ганса
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
PROPN –[flat]–> PROPN (146; 78%),
NOUN –[conj]–> NOUN (108; 76%),
PROPN –[conj]–> PROPN (43; 91%),
NOUN –[nsubj]–> NOUN (41; 85%),
NOUN –[appos]–> PROPN (33; 97%),
NOUN –[amod]–> NOUN (29; 54%),
PROPN –[compound]–> NOUN (15; 71%),
PROPN –[flat]–> NOUN (15; 58%),
PROPN –[list]–> PROPN (12; 100%),
NOUN –[parataxis]–> NOUN (10; 77%).