Treebank Statistics: UD_Belarusian-HSE: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
126689 tokens (42%) have a non-empty value of Gender
.
37278 types (72%) occur at least once with a non-empty value of Gender
.
18160 lemmas (62%) occur at least once with a non-empty value of Gender
.
The feature is used with 11 part-of-speech tags: NOUN (71386; 23% instances), PROPN (18806; 6% instances), ADJ (17068; 6% instances), VERB (8180; 3% instances), PRON (5555; 2% instances), DET (4289; 1% instances), AUX (848; 0% instances), NUM (516; 0% instances), ADV (32; 0% instances), SYM (8; 0% instances), CCONJ (1; 0% instances).
NOUN
71386 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (59221; 83%), Number=Sing (51024; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(25834; 36% of non-emptyGender
): сядзіба, мовы, абароны, варта, тысяч, гісторыі, мову, волі, працы, моваMasc
(37090; 52% of non-emptyGender
): дзень, людзей, чалавек, годзе, гадоў, час, людзі, года, год, годуNeut
(8462; 12% of non-emptyGender
): відэа, месца, фота, імя, радыё, жыццё, дзяцей, месцы, кіно, праваEMPTY
(1300): Арт, г., вул., км, смі, ст., BYN, АМАП, рэж., АЭС
Paradigm месца | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | месца | ||
Case=Acc|Number=Plur | месцы | месцы | |
Case=Dat|Number=Sing | месцу | ||
Case=Dat|Number=Plur | месцам | ||
Case=Gen|Number=Sing | месца | ||
Case=Gen|Number=Plur | месцаў, месц | ||
Case=Ins|Number=Sing | месцам | ||
Case=Ins|Number=Plur | Месцамі | ||
Case=Loc|Number=Sing | месцы | месцы | |
Case=Loc|Number=Plur | месцах | ||
Case=Nom|Number=Sing | меца | месца | |
Case=Nom|Number=Sing|Typo=Yes | месяца | ||
Case=Nom|Number=Plur | месцы |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (8881) occur only with one value of Gender
.
PROPN
18806 PROPN tokens (92% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (17673; 94%), Animacy=Anim (10653; 57%).
PROPN
tokens may have the following values of Gender
:
Fem
(7106; 38% of non-emptyGender
): Беларусі, Беларусь, курапатах, Курапатаў, Курапаты, Расеі, Горадні, Ціханоўскай, Свабоды, РасеяMasc
(11271; 60% of non-emptyGender
): Менску, Лукашэнка, Лукашэнкі, Менск, Лукашэнку, Сяргей, Ціханоўскага, Аляксандар, Андрэй, МашэраваNeut
(429; 2% of non-emptyGender
): Берасьці, МУТНАЕВОКА, мінздароўя, Дынама, БелТА, Берасьця, Гродна, Берасьце, Еўрарадыё, МутнаевокаEMPTY
(1577): ЗША, COVID, БНР, БССР, БНФ, КДБ, ЦВК, ссср, БРСМ, А.
Paradigm Каляда | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Nom|NameType=Prs|Number=Sing | Каляда | ||
Animacy=Anim|Case=Nom|NameType=Sur|Number=Sing | Каляда | ||
Animacy=Inan|Case=Acc|NameType=Oth|Number=Plur | Каляды |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (3641) occur only with one value of Gender
.
ADJ
17068 ADJ tokens (64% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (17065; 100%), Degree=Pos (16851; 99%), Animacy=EMPTY (15302; 90%).
ADJ
tokens may have the following values of Gender
:
Fem
(6766; 40% of non-emptyGender
): беларускай, беларускую, беларуская, роднай, першай, народнай, першая, курапацкай, новая, новуюMasc
(7753; 45% of non-emptyGender
): новы, беларускі, першы, добры, беларускага, вялікі, былы, другі, новага, вольныNeut
(2549; 15% of non-emptyGender
): вядома, магчыма, важна, першае, цывільным, цікава, галоўнае, вялікае, годна, беларускаеEMPTY
(9748): надзвычайных, беларускіх, беларускія, 2019, розных, 2018, новыя, 12, 23, 1
Paradigm беларускі | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | беларускага | ||
Animacy=Inan|Case=Acc | беларускі | беларускае | |
Case=Acc | беларускую | ||
Case=Dat | беларускаму | беларускай | беларускаму |
Case=Gen | беларускага | беларускай, беларускае, беларуская | беларускага |
Case=Gen|Typo=Yes | беларускай | ||
Case=Ins | беларускім | беларускай | беларускім |
Case=Loc | беларускім | беларускай | беларускім |
Case=Nom | беларускі, Беларускi | беларуская | беларускае |
VERB
8180 VERB tokens (26% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=EMPTY (8178; 100%), Number=Sing (8175; 100%), Tense=Past (8152; 100%), Mood=Ind (6747; 82%), VerbForm=Fin (6747; 82%), Aspect=Perf (6534; 80%), Voice=Act (5260; 64%).
VERB
tokens may have the following values of Gender
:
Fem
(2523; 31% of non-emptyGender
): стала, адбылася, сказала, была, выйшла, расказала, пачала, памерла, прайшла, паведамілаMasc
(4657; 57% of non-emptyGender
): сказаў, стаў, памёр, атрымаў, заявіў, расказаў, прайшоў, мог, адказаў, заклікаўNeut
(1000; 12% of non-emptyGender
): было, адбылося, стала, засталося, пачалося, атрымалася, выйшла, зроблена, адбывалася, прайшлоEMPTY
(22912): можна, трэба, можа, жыве, няма, мае, адбудзецца, затрымалі, кажа, пачалі
Paradigm магчы | Masc | Fem | Neut |
---|---|---|---|
мог | магла | магло |
PRON
5555 PRON tokens (54% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (5552; 100%), Person=EMPTY (4056; 73%), Case=Nom (2910; 52%).
PRON
tokens may have the following values of Gender
:
Fem
(820; 15% of non-emptyGender
): яна, якая, яе, якой, ёй, якую, ёю, беларуска, вышынёй, штоMasc
(2190; 39% of non-emptyGender
): ён, які, хто, яго, яму, якім, ім, якога, каго, ніхтоNeut
(2545; 46% of non-emptyGender
): гэта, што, тое, таго, тым, ўсё, усё, нічога, чым, гэтымEMPTY
(4768): мы, я, якія, яны, вы, нас, іх, вас, нам, мяне
Paradigm які | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|PronType=Rel | якога | якога | |
Animacy=Anim|Case=Ins|Number=Sing|PronType=Rel | якiм | ||
Animacy=Inan|Case=Acc|Number=Sing|PronType=Rel | які, якi | якое | |
Animacy=Inan|Case=Dat|Number=Sing|PronType=Rel | якому | ||
Case=Acc|Number=Sing | якую | ||
Case=Acc|Number=Sing|PronType=Rel | якую | ||
Case=Dat|Number=Sing|PronType=Rel | якому | якой | |
Case=Dat|Number=Plur|PronType=Rel | якім | ||
Case=Gen|Number=Sing|PronType=Rel | якога | якой | якога |
Case=Ins|Number=Sing|PronType=Rel | якім | якой, якою | Якім |
Case=Loc|Number=Sing|PronType=Rel | якім | якой | якім |
Case=Nom|Number=Sing | якая | ||
Case=Nom|Number=Sing|PronType=Rel | які, якi | якая | якое |
DET
4289 DET tokens (64% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (4285; 100%), Reflex=EMPTY (3737; 87%), Animacy=EMPTY (3452; 80%), Poss=EMPTY (2743; 64%).
DET
tokens may have the following values of Gender
:
Fem
(1481; 35% of non-emptyGender
): сваю, сваёй, нашай, гэтую, гэтай, наша, адной, гэтая, такая, такойMasc
(2157; 50% of non-emptyGender
): гэты, наш, свой, кожны, адзін, той, тым, гэтым, нашым, гэтагаNeut
(651; 15% of non-emptyGender
): самае, такое, сваё, гэтае, ўсё, усё, іншае, адно, гэтым, маёEMPTY
(2441): яго, яе, іх, свае, іншых, усе, іншыя, гэтыя, тых, ўсе
Paradigm наш | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | нашага | ||
Animacy=Inan|Case=Acc | наш, нам | нашае, наша | |
Case=Acc | нашу, нашую | ||
Case=Dat | нашаму | нашай | |
Case=Gen | нашага, наша | нашай, нашае | нашага |
Case=Ins | нашым | нашай | нашым |
Case=Loc | нашым | нашай | нашым |
Case=Nom | наш, НАШЫ | наша, нашая, Ніша | наша, нашае, Наше |
AUX
848 AUX tokens (41% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (848; 100%), Person=EMPTY (848; 100%), Mood=Ind (845; 100%), Tense=Past (845; 100%), VerbForm=Fin (845; 100%), Voice=Act (845; 100%), Aspect=EMPTY (675; 80%).
AUX
tokens may have the following values of Gender
:
Fem
(144; 17% of non-emptyGender
): была, будуMasc
(349; 41% of non-emptyGender
): быў, БУДЗЕNeut
(355; 42% of non-emptyGender
): было, былаEMPTY
(1236): будзе, былі, будуць, б, быць, будзем, ёсць, бы, буду, будзеш
Paradigm быць | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | буду | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | Быў | ||
Case=Loc | БУДЗЕ | ||
Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
NUM
516 NUM tokens (9% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (498; 97%).
NUM
tokens may have the following values of Gender
:
Fem
(136; 26% of non-emptyGender
): адна, дзьве, дзве, адну, паўтары, дзьвюх, абедзьве, дзвюма, дзвюх, аднойMasc
(354; 69% of non-emptyGender
): два, адзін, двух, аднаго, паўтара, двума, абодва, абодвух, двум, паўтарыNeut
(26; 5% of non-emptyGender
): адно, аднаго, адным, Два, ОбаEMPTY
(5330): 10, 2, 5, некалькі, 1, тры, 20, 3, 100, колькі
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|NumType=Card | двух | дзьвюх | |
Animacy=Inan|Case=Acc|NumType=Card | два | дзьве, дзве, две | |
Case=Dat|NumType=Card | двум | ||
Case=Gen|NumType=Card | двух, дзвюх | дзвюх, дзьвюх | |
Case=Ins|NumType=Card | двума | дзьвюма | |
Case=Loc|NumType=Card | двух | дзвюх, двух, дзьвюх | |
Case=Nom | два | дзве | |
Case=Nom|NumType=Card | два | дзьве, дзве | Два |
ADV
32 ADV tokens (0% of all ADV
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADV
and Gender
co-occurred: Degree=Pos (32; 100%).
ADV
tokens may have the following values of Gender
:
Fem
(12; 38% of non-emptyGender
): Абавязкова, канчаткова, цікава, абавязковы, крута, незвычаяна, сезонна, сьветапоглядна, эмацыйнаMasc
(17; 53% of non-emptyGender
): годна, палітычна, ўрачыста, пераважна, файна, фізічна, цёпла, эмацыйна, ўважліваNeut
(3; 9% of non-emptyGender
): канчаткова, часоваEMPTY
(11008): як, яшчэ, больш, тут, таксама, так, дзе, таму, ўжо, цяпер
Paradigm канчаткова | Fem | Neut |
---|---|---|
Case=Gen | канчаткова | |
Case=Nom | канчаткова |
SYM
8 SYM tokens (0% of all SYM
tokens) have a non-empty value of Gender
.
SYM
tokens may have the following values of Gender
:
Masc
(8; 100% of non-emptyGender
): °СEMPTY
(2604): %, 📌, >, </a>, ⚡, +, 🔥, ⚡️, №, 👉
CCONJ
1 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Gender
.
CCONJ
tokens may have the following values of Gender
:
Fem
(1; 100% of non-emptyGender
): iEMPTY
(8999): і, а, але, ці, ды, або, й, ні, Таксама, аднак
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (13660; 69%),
PROPN –[flat:name]–> PROPN (3630; 97%),
NOUN –[det]–> DET (3150; 63%),
NOUN –[conj]–> NOUN (2473; 51%),
NOUN –[appos]–> PROPN (1650; 70%),
VERB –[nsubj]–> PROPN (1029; 55%),
PROPN –[conj]–> PROPN (731; 70%),
VERB –[nsubj:pass]–> NOUN (477; 62%),
ADJ –[conj]–> ADJ (440; 91%),
PROPN –[amod]–> ADJ (412; 82%).