Treebank Statistics: UD_Bulgarian-BTB: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
58980 tokens (38%) have a non-empty value of Gender
.
19497 types (74%) occur at least once with a non-empty value of Gender
.
11282 lemmas (76%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (33602; 22% instances), ADJ (9557; 6% instances), PROPN (8342; 5% instances), PRON (3244; 2% instances), VERB (1822; 1% instances), DET (1718; 1% instances), NUM (515; 0% instances), AUX (179; 0% instances), ADP (1; 0% instances).
NOUN
33602 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (23922; 71%), Definite=Ind (20591; 61%).
NOUN
tokens may have the following values of Gender
:
Fem
(12090; 36% of non-emptyGender
): г., година, години, част, страната, страна, политика, пари, страни, работаMasc
(14159; 42% of non-emptyGender
): %, лв., млн., президентът, път, края, съвет, човек, министър, денNeut
(7353; 22% of non-emptyGender
): време, събрание, решение, място, правителството, право, началото, времето, решението, делотоEMPTY
(550): хората, хора, души, преговори, преговорите, глава, собственост, партия, президент, финансите
Paradigm глава | Masc | Fem |
---|---|---|
Definite=Def|Number=Sing | главата | |
Definite=Def|Number=Plur | главите | |
Definite=Ind|Number=Sing | глава | глава |
Definite=Ind|Number=Plur | глави |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (5501) occur only with one value of Gender
.
ADJ
9557 ADJ tokens (70% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (9557; 100%), Degree=Pos (9044; 95%), Aspect=EMPTY (8705; 91%), VerbForm=EMPTY (8705; 91%), Voice=EMPTY (8705; 91%), Definite=Ind (5220; 55%).
ADJ
tokens may have the following values of Gender
:
Fem
(3852; 40% of non-emptyGender
): българската, нова, европейската, цялата, 2001, 2000, голяма, миналата, националната, новатаMasc
(3687; 39% of non-emptyGender
): друг, новия, европейския, българския, нов, 1, новият, втори, първи, бившияNeut
(2018; 21% of non-emptyGender
): народното, същото, цялото, друго, българското, народно, ново, новото, голямо, първотоEMPTY
(4034): други, другите, последните, нови, новите, първите, различни, българските, големи, въоръжените
Paradigm нов | Masc | Fem | Neut |
---|---|---|---|
Case=Voc|Degree=Pos | Нови | ||
Definite=Def|Degree=Pos | новия, новият | новата | новото |
Definite=Def|Degree=Sup | най-новият | най-новата | Най-новото |
Definite=Ind|Degree=Pos | нов | нова | ново |
PROPN
8342 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (8213; 98%), Definite=Ind (8057; 97%).
PROPN
tokens may have the following values of Gender
:
Fem
(2734; 33% of non-emptyGender
): България, София, Европа, Турция, Югославия, Русия, БСП, Франция, Германия, РумънияMasc
(5216; 63% of non-emptyGender
): Иван, ЕС, СДС, Петър, Стоянов, Костов, Георги, САЩ, Димитър, ЙорданNeut
(392; 5% of non-emptyGender
): МВР, Косово, ДПС, Русе, БНР, НС, Панчарево, Би, РМД, ТърновоEMPTY
(93): де, Р-300, ван, -, 2000, Кремиковци, ал, ди, дела, дьо
Paradigm а | Masc | Fem | Neut |
---|---|---|---|
А | А | а |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (2863) occur only with one value of Gender
.
PRON
3244 PRON tokens (32% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (3244; 100%), Poss=EMPTY (3244; 100%), Reflex=EMPTY (3244; 100%), Case=Nom (2234; 69%), Person=3 (1781; 55%), PronType=Prs (1781; 55%).
PRON
tokens may have the following values of Gender
:
Fem
(684; 21% of non-emptyGender
): тя, която, я, нея, й, коя, Едната, ТазиMasc
(1541; 48% of non-emptyGender
): той, го, който, му, него, кой, никой, някой, кого, всекиNeut
(1019; 31% of non-emptyGender
): това, което, го, то, всичко, нищо, нещо, него, кое, всичкотоEMPTY
(6850): се, си, които, му, ни, те, им, ми, аз, ти
Paradigm аз | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | го, него | я, нея | го, него |
Case=Dat | му, нему | й | му |
Case=Nom | той | тя | то |
й |
VERB
1822 VERB tokens (11% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (1822; 100%), Number=Sing (1822; 100%), Person=EMPTY (1822; 100%), VerbForm=Part (1822; 100%), Definite=Ind (1821; 100%), Aspect=Perf (1375; 75%), Voice=Act (1112; 61%), Tense=Past (950; 52%).
VERB
tokens may have the following values of Gender
:
Fem
(486; 27% of non-emptyGender
): могла, можела, получила, представена, приета, започнала, избрана, поставена, щяла, включенаMasc
(982; 54% of non-emptyGender
): направил, дал, заминал, искал, казал, дошъл, избран, имал, станал, видялNeut
(354; 19% of non-emptyGender
): имало, трябвало, направено, станало, нямало, налагало, могло, прието, свързано, взетоEMPTY
(15006): има, няма, може, трябва, каза, могат, съобщи, заяви, стана, имат
Paradigm мога | Masc | Fem | Neut |
---|---|---|---|
Tense=Imp | можел | можела | можело |
Tense=Past | могъл | могла | могло |
DET
1718 DET tokens (71% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (1718; 100%), Person=EMPTY (1461; 85%), Poss=EMPTY (1382; 80%), Definite=EMPTY (1119; 65%), Case=EMPTY (1029; 60%).
DET
tokens may have the following values of Gender
:
Fem
(595; 35% of non-emptyGender
): тази, една, всяка, каква, нашата, такава, тая, неговата, своята, някакваMasc
(620; 36% of non-emptyGender
): този, един, всеки, такъв, своя, какъв, тоя, никакъв, някой, някакъвNeut
(503; 29% of non-emptyGender
): това, какво, едно, всяко, такова, своето, тяхното, негово, някакво, нашетоEMPTY
(715): тези, всички, нашите, някои, какви, своите, такива, техните, наши, тия
Paradigm този | Masc | Fem | Neut |
---|---|---|---|
Case=Nom | тази, тая, онази, тeзи | това, онова, туй | |
този, тоя, оня, онзи |
NUM
515 NUM tokens (24% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (515; 100%), Definite=Ind (448; 87%), Number=Plur (282; 55%).
NUM
tokens may have the following values of Gender
:
Fem
(202; 39% of non-emptyGender
): две, една, двете, 2, 1, 0, 22, 52, 42, 0.00Masc
(212; 41% of non-emptyGender
): един, два, 2, двата, 1, 22, Единият, 32, 4162, 62Neut
(101; 20% of non-emptyGender
): едно, 1, две, двете, едното, 42EMPTY
(1590): 3, три, 10, двамата, 20, 000, 15, 4, 5, 6
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Definite=Def | двата | двете | двете |
Definite=Ind | два, 2 | две, 2 | две |
AUX
179 AUX tokens (2% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (179; 100%), Mood=Ind (179; 100%), Number=Sing (179; 100%), Person=EMPTY (179; 100%), Tense=EMPTY (179; 100%), VerbForm=Part (179; 100%), Voice=Act (179; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(60; 34% of non-emptyGender
): билаMasc
(83; 46% of non-emptyGender
): билNeut
(36; 20% of non-emptyGender
): билоEMPTY
(8955): да, е, ще, са, бе, бъде, беше, бяха, съм, бъдат
Paradigm съм | Masc | Fem | Neut |
---|---|---|---|
бил | била | било |
ADP
1 ADP tokens (0% of all ADP
tokens) have a non-empty value of Gender
.
ADP
tokens may have the following values of Gender
:
Neut
(1; 100% of non-emptyGender
): сравнениеEMPTY
(22095): на, в, за, от, с, по, до, след, като, през
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7988; 70%),
NOUN –[nmod]–> PROPN (1793; 55%),
PROPN –[flat]–> PROPN (1522; 95%),
NOUN –[det]–> DET (1360; 69%),
PROPN –[conj]–> PROPN (416; 71%),
ADJ –[nsubj]–> NOUN (285; 73%),
ADJ –[conj]–> ADJ (249; 97%),
PROPN –[nmod]–> PROPN (247; 72%),
PROPN –[amod]–> ADJ (239; 82%),
PROPN –[nmod]–> NOUN (225; 67%).