Treebank Statistics: UD_Belarusian-HSE: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
131955 tokens (43%) have a non-empty value of Case
.
37556 types (73%) occur at least once with a non-empty value of Case
.
17338 lemmas (59%) occur at least once with a non-empty value of Case
.
The feature is used with 11 part-of-speech tags: NOUN (71395; 23% instances), ADJ (22796; 7% instances), PROPN (18806; 6% instances), PRON (10311; 3% instances), DET (6218; 2% instances), NUM (1322; 0% instances), VERB (1063; 0% instances), ADV (32; 0% instances), SYM (8; 0% instances), AUX (3; 0% instances), CCONJ (1; 0% instances).
NOUN
71395 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Animacy=Inan (59227; 83%), Number=Sing (51024; 71%), Gender=Masc (37090; 52%).
NOUN
tokens may have the following values of Case
:
Acc
(14880; 21% of non-emptyCase
): дзень, час, год, гады, мову, людзей, раз, каранавірус, дні, тыдзеньDat
(1276; 2% of non-emptyCase
): людзям, беларусам, сябрам, вуліцы, карэспандэнту, жанчынам, спасылцы, абаронцам, журналістам, народуGen
(23143; 32% of non-emptyCase
): гадоў, года, людзей, чалавек, году, сакавіка, красавіка, мовы, лістапада, абароныIns
(4773; 7% of non-emptyCase
): часам, чынам, заканадаўствам, каранавірусам, днём, людзьмі, назвай, мовай, удзелам, мяжойLoc
(7669; 11% of non-emptyCase
): годзе, сiтуацыях, цэнтры, краіне, выніку, горадзе, месцы, сайце, сядзібе, варцеNom
(19642; 28% of non-emptyCase
): людзі, сядзіба, сябры, дзень, арт, гурт, відэа, фота, варта, беларусыVoc
(12; 0% of non-emptyCase
): дружа, божа, браце, Госпадзі, Ойча, краю, саколе, чалавечаEMPTY
(1291): Арт, г., вул., км, смі, ст., BYN, АМАП, рэж., АЭС
Paradigm чалавек | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Number=Sing | чалавек | чалавека | чалавеку | чалавека | чалавеча | чалавекам | |
Animacy=Anim|Number=Plur | людзі, чалавекі, людзi, людзт | людзей, чалавек, чалавекі | людзям | людзей, чалавек, людей, чалавекаў | людзях | людзьмі, людзмі, людзямі, людзі | |
Animacy=Anim|Number=Plur|Typo=Yes | чалаве | ||||||
Number=Plur | людзей |
ADJ
22796 ADJ tokens (85% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (22471; 99%), Animacy=EMPTY (19755; 87%), Number=Sing (16409; 72%).
ADJ
tokens may have the following values of Case
:
Acc
(4208; 18% of non-emptyCase
): беларускую, новы, першы, новую, апошнія, новыя, беларускія, першую, другі, розныяDat
(328; 1% of non-emptyCase
): беларускаму, беларускай, беларускім, маладым, народнаму, расейскай, чырвона-беламу, Чырвонай, блізкім, ваеннамуGen
(6761; 30% of non-emptyCase
): беларускай, беларускіх, беларускага, новага, розных, надзвычайных, роднай, менскага, нацыянальнага, народнайIns
(1921; 8% of non-emptyCase
): першым, беларускай, беларускімі, новым, бяспечным, беларускім, апошнім, вялікім, першай, бел-чырвона-белымLoc
(2375; 10% of non-emptyCase
): надзвычайных, беларускай, менскім, беларускім, цывільным, розных, сацыяльных, новым, першым, курапацкайNom
(7203; 32% of non-emptyCase
): беларуская, беларускі, новы, добры, беларускія, першы, былы, вялікі, першая, БяспечныEMPTY
(4020): 2019, вядома, 2018, 12, 23, 1, 18, 25, 3, магчыма
Paradigm беларускі | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | беларускага | |||||
Animacy=Anim|Number=Plur | беларускіх | |||||
Animacy=Inan|Gender=Masc|Number=Sing | беларускі | |||||
Animacy=Inan|Gender=Neut|Number=Sing | беларускае | |||||
Animacy=Inan|Number=Plur | беларускія, беларускiя | |||||
Gender=Masc|Number=Sing | беларускі, Беларускi | беларускаму | беларускага | беларускім | беларускім | |
Gender=Fem|Number=Sing | беларуская | беларускую | беларускай | беларускай, беларускае, беларуская | беларускай | беларускай |
Gender=Fem|Number=Sing|Typo=Yes | беларускай | |||||
Gender=Neut|Number=Sing | беларускае | беларускаму | беларускага | беларускім | беларускім | |
Number=Plur | беларускія, Беларускiя | беларускім | беларускіх | беларускіх, Беларускім, беларускiх | беларускімі |
PROPN
18806 PROPN tokens (92% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (17673; 94%), Gender=Masc (11271; 60%), Animacy=Anim (10653; 57%).
PROPN
tokens may have the following values of Case
:
Acc
(1698; 9% of non-emptyCase
): Беларусь, Курапаты, Лукашэнку, Менск, Ціханоўскую, Расею, Севярынца, Ціханоўскага, Сьвятлану, ПаўлаDat
(551; 3% of non-emptyCase
): Беларусі, Свабодзе, Лукашэнку, Менску, Сяргею, Леаніду, Дзянісу, Максіму, Паўлу, СевярынцуGen
(5292; 28% of non-emptyCase
): Беларусі, Курапатаў, Лукашэнкі, Менску, Свабоды, Ціханоўскай, Расеі, Машэрава, Ціханоўскага, АляксандраIns
(776; 4% of non-emptyCase
): Расеяй, Беларусьсю, Лукашэнкам, Менскам, Паўлам, Аляксандрам, Беларуссю, Пуціным, Сяргеем, ЦіханоўскайLoc
(2523; 13% of non-emptyCase
): Менску, Беларусі, курапатах, Горадні, Магілёве, Мінску, Віцебску, Вільні, Гомелі, БерасьціNom
(7963; 42% of non-emptyCase
): Беларусь, Лукашэнка, Курапаты, Менск, Сяргей, Андрэй, Аляксандар, Севярынец, Максім, АлесьVoc
(3; 0% of non-emptyCase
): Іване, ЛявонеEMPTY
(1577): ЗША, COVID, БНР, БССР, БНФ, КДБ, ЦВК, ссср, БРСМ, А.
Paradigm Беларусь | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
NameType=Com | Беларусь | |||||
NameType=Geo | Беларусь, БЕЛАРУСЬ | Беларусь, БЕЛАРУСЬ | Беларусі, БЕЛАРУСІ, Беларусi | Беларусі, БЕЛАРУСІ, Беларусi, Беларуси | Беларусі, БЕЛАРУСІ, Беларусi, БЭЛАРУСІ, Беларуси | Беларусьсю, Беларуссю, БЕЛАРУСЬСЮ |
NameType=Geo|Typo=Yes | Беларусь | Беларусь |
PRON
10311 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Animacy=EMPTY (7138; 69%), Number=Sing (6603; 64%), PronType=Prs (5453; 53%).
PRON
tokens may have the following values of Case
:
Acc
(2024; 20% of non-emptyCase
): што, яго, гэта, іх, тое, яе, нас, вас, мяне, сябеDat
(827; 8% of non-emptyCase
): нам, вам, мне, яму, ім, сабе, усім, ёй, табе, камуGen
(1207; 12% of non-emptyCase
): нас, іх, вас, таго, нічога, яго, мяне, якога, гэтага, якіхIns
(467; 5% of non-emptyCase
): намі, чым, ім, тым, імі, сабой, гэтым, ёй, якім, ваміLoc
(301; 3% of non-emptyCase
): якім, тым, гэтым, ім, якой, якіх, чым, ёй, сабе, iхNom
(5485; 53% of non-emptyCase
): мы, гэта, я, ён, якія, што, які, хто, яны, выEMPTY
(12): што, т., то, Гэта, г.
Paradigm які | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing|PronType=Rel | якога | якiм | ||||
Animacy=Anim|Gender=Neut|Number=Sing|PronType=Rel | якога | |||||
Animacy=Anim|Number=Plur|PronType=Rel | якіх | якіх | ||||
Animacy=Inan|Gender=Masc|Number=Sing|PronType=Rel | які, якi | |||||
Animacy=Inan|Gender=Fem|Number=Sing|PronType=Rel | якому | |||||
Animacy=Inan|Gender=Neut|Number=Sing|PronType=Rel | якое | |||||
Animacy=Inan|Number=Plur|PronType=Rel | якія | |||||
Gender=Masc|Number=Sing|PronType=Rel | які, якi | якому | якога | якім | якім | |
Gender=Masc|Number=Plur|PronType=Rel | якім | |||||
Gender=Fem|Number=Sing | якая | якую | ||||
Gender=Fem|Number=Sing|PronType=Rel | якая | якую | якой | якой | якой | якой, якою |
Gender=Neut|Number=Sing|PronType=Rel | якое | якога | якім | Якім | ||
Number=Plur|PronType=Rel | якія, якiя, які | якіх | якім | якіх, якiх | якіх | якімі |
DET
6218 DET tokens (92% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Reflex=EMPTY (5451; 88%), Animacy=EMPTY (4833; 78%), Number=Sing (4285; 69%), Poss=EMPTY (4160; 67%).
DET
tokens may have the following values of Case
:
Acc
(1793; 29% of non-emptyCase
): свой, гэты, сваю, свае, гэтую, наш, той, сваё, іншыя, гэтыяDat
(209; 3% of non-emptyCase
): тым, нашаму, вашай, кожнаму, усім, нашай, ўсёй, ўсім, нашым, іншымGen
(1147; 18% of non-emptyCase
): іншых, тых, гэтага, нашай, гэтай, самых, нашых, нашага, сваіх, такіхIns
(492; 8% of non-emptyCase
): такім, адным, сваёй, гэтым, адной, тым, сваімі, самым, сваім, такойLoc
(671; 11% of non-emptyCase
): нашым, тым, гэтым, сваім, адным, нашай, сваёй, гэтай, ўсіх, аднойNom
(1906; 31% of non-emptyCase
): наш, адзін, усе, наша, гэты, кожны, самае, гэтыя, іншыя, такіяEMPTY
(512): яго, яе, іх, iх, інш., н., мае, т.
Paradigm наш | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | нашага | |||||
Animacy=Anim|Number=Plur | нашых | |||||
Animacy=Inan|Gender=Masc|Number=Sing | наш, нам | |||||
Animacy=Inan|Gender=Neut|Number=Sing | нашае, наша | |||||
Animacy=Inan|Number=Plur | нашыя, нашы | |||||
Gender=Masc|Number=Sing | наш, НАШЫ | нашаму | нашага, наша | нашым | нашым | |
Gender=Fem|Number=Sing | наша, нашая, Ніша | нашу, нашую | нашай | нашай, нашае | нашай | нашай |
Gender=Neut|Number=Sing | наша, нашае, Наше | нашага | нашым | нашым | ||
Number=Plur | нашы, нашыя, 👏🏼Нашыя | нашым | нашых | нашых | нашымі |
NUM
1322 NUM tokens (23% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (972; 74%).
NUM
tokens may have the following values of Case
:
Acc
(581; 44% of non-emptyCase
): некалькі, два, тры, адзін, колькі, пяць, чатыры, адну, дзесяць, дзьвеDat
(5; 0% of non-emptyCase
): двум, тромGen
(189; 14% of non-emptyCase
): трох, двух, некалькіх, аднаго, чатырох, многіх, пяці, абодвух, дзевяці, некалькіIns
(23; 2% of non-emptyCase
): двума, дзвюма, адной, адным, дзьвюма, трыма, чатырма, дзвюмяLoc
(47; 4% of non-emptyCase
): некалькіх, двух, чатырох, многіх, трох, адным, дзвюх, дзевяці, абедзвюх, дзьвюхNom
(477; 36% of non-emptyCase
): некалькі, колькі, два, тры, адзін, адна, чатыры, дзьве, столькі, двоеEMPTY
(4524): 10, 2, 5, 1, 20, 3, 100, 15, 19:00, 18
Paradigm два | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|NumType=Card | двух | |||||
Animacy=Anim|Gender=Fem|NumType=Card | дзьвюх | |||||
Animacy=Inan|Gender=Masc|NumType=Card | два | |||||
Animacy=Inan|Gender=Fem|NumType=Card | дзьве, дзве, две | |||||
Gender=Masc | два | |||||
Gender=Masc|NumType=Card | два | двум | двух, дзвюх | двух | двума | |
Gender=Fem | дзве | |||||
Gender=Fem|NumType=Card | дзьве, дзве | дзвюх, дзьвюх | дзвюх, двух, дзьвюх | дзьвюма | ||
Gender=Neut|NumType=Card | Два | |||||
NumType=Card | дзвюмя |
VERB
1063 VERB tokens (3% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Mood=EMPTY (1063; 100%), Person=EMPTY (1062; 100%), VerbForm=Part (1056; 99%), Tense=Past (1014; 95%), Voice=Pass (1001; 94%), Aspect=Perf (949; 89%), Number=Sing (543; 51%).
VERB
tokens may have the following values of Case
:
Acc
(195; 18% of non-emptyCase
): затрыманых, звязаныя, пастаўлены, прысвечаную, прысвечаны, дэмантаваныя, забытыя, забітага, зьвязаныя, прадугледжануюDat
(25; 2% of non-emptyCase
): рэпрэсаваным, закатаваным, затрыманым, Аб’яднаным, Адышоўшым, Забіваным, адабранай, адданым, адмарожаным, арыштаванамуGen
(359; 34% of non-emptyCase
): расстраляных, затрыманых, затрыманага, забітых, рэпрэсаваных, пералічаных, званага, асуджанага, захварэлых, падазраваныхIns
(96; 9% of non-emptyCase
): павешаным, затрыманымі, зьвязанымі, адданым, зачыненымі, зьняволеным, накінутай, разарванай, уключанымі, ЗатрыманымLoc
(72; 7% of non-emptyCase
): устаноўленым, ўстаноўленым, прадугледжаных, Злучаных, забруджаных, звязаных, знішчаных, абсталяваных, адведзеных, адрасаванайNom
(316; 30% of non-emptyCase
): звязаныя, жадаючы, званая, прысвечаны, распаведзеная, сабраныя, Прыняты, асуджаны, датаваны, заслужаныEMPTY
(30029): можна, трэба, можа, жыве, няма, стала, мае, адбудзецца, затрымалі, сказаў
Paradigm затрымаць | Nom | Acc | Dat | Gen | Ins |
---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | затрыманага | ||||
Animacy=Anim|Number=Plur | затрыманых | ||||
Gender=Masc|Number=Sing | затрыманы | затрыманага | Затрыманым | ||
Gender=Fem|Number=Sing | затрыманай | ||||
Number=Plur | Затрыманыя | затрыманым | затрыманых | затрыманымі |
ADV
32 ADV tokens (0% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: Degree=Pos (32; 100%).
ADV
tokens may have the following values of Case
:
Gen
(7; 22% of non-emptyCase
): Абавязкова, канчаткова, абавязковы, часова, ўважліваNom
(25; 78% of non-emptyCase
): годна, канчаткова, палітычна, цікава, эмацыйна, ўрачыста, крута, незвычаяна, пераважна, сезоннаEMPTY
(11008): як, яшчэ, больш, тут, таксама, так, дзе, таму, ўжо, цяпер
Paradigm канчаткова | Nom | Gen |
---|---|---|
Gender=Fem | канчаткова | |
Gender=Neut | канчаткова |
Case
seems to be lexical feature of ADV
. 94% lemmas (16) occur only with one value of Case
.
SYM
8 SYM tokens (0% of all SYM
tokens) have a non-empty value of Case
.
SYM
tokens may have the following values of Case
:
Gen
(8; 100% of non-emptyCase
): °СEMPTY
(2604): %, 📌, >, </a>, ⚡, +, 🔥, ⚡️, №, 👉
AUX
3 AUX tokens (0% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Aspect=EMPTY (3; 100%), Mood=EMPTY (3; 100%), Number=Sing (3; 100%), Person=EMPTY (3; 100%), Tense=EMPTY (3; 100%), VerbForm=EMPTY (3; 100%), Voice=EMPTY (3; 100%), Gender=Fem (2; 67%).
AUX
tokens may have the following values of Case
:
Acc
(2; 67% of non-emptyCase
): будуLoc
(1; 33% of non-emptyCase
): БУДЗЕEMPTY
(2081): будзе, быў, было, былі, была, будуць, б, быць, будзем, ёсць
Paradigm быць | Acc | Loc |
---|---|---|
Animacy=Inan|Gender=Fem | буду | |
Gender=Masc | БУДЗЕ |
CCONJ
1 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Case
.
CCONJ
tokens may have the following values of Case
:
Gen
(1; 100% of non-emptyCase
): iEMPTY
(8999): і, а, але, ці, ды, або, й, ні, Таксама, аднак
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (18835; 95%),
NOUN –[det]–> DET (4528; 91%),
NOUN –[conj]–> NOUN (4466; 93%),
PROPN –[flat:name]–> PROPN (3626; 97%),
NOUN –[appos]–> PROPN (1442; 61%),
PROPN –[conj]–> PROPN (1004; 96%),
ADJ –[conj]–> ADJ (650; 97%),
NOUN –[nummod]–> NUM (628; 51%),
NOUN –[acl]–> VERB (437; 65%),
PROPN –[amod]–> ADJ (435; 86%).