Treebank Statistics: UD_Russian-GSD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
50176 tokens (51%) have a non-empty value of Gender
.
24612 types (82%) occur at least once with a non-empty value of Gender
.
15059 lemmas (80%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (26754; 27% instances), ADJ (9543; 10% instances), PROPN (6584; 7% instances), VERB (3857; 4% instances), PRON (1428; 1% instances), DET (824; 1% instances), NUM (607; 1% instances), AUX (579; 1% instances).
NOUN
26754 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (23057; 86%), Number=Sing (20138; 75%).
NOUN
tokens may have the following values of Gender
:
Fem
(8245; 31% of non-emptyGender
): области, войны, реки, территории, часть, части, компании, площадь, армии, группыMasc
(13351; 50% of non-emptyGender
): года, году, лет, человек, год, км, города, г., районе, составNeut
(5158; 19% of non-emptyGender
): время, население, населения, название, место, начале, качестве, село, времени, даннымEMPTY
(60): No, n, ВЧ, C, T, f, i, x, ЛГБТ, С
Paradigm год | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Loc|Number=Sing | году | |
Animacy=Inan|Case=Acc|Number=Sing | год, года | |
Animacy=Inan|Case=Acc|Number=Plur | годы, гг., лет, годов | годы |
Animacy=Inan|Case=Dat|Number=Sing | году | |
Animacy=Inan|Case=Dat|Number=Plur | годам, гг. | |
Animacy=Inan|Case=Gen|Number=Sing | года, г., гг. | |
Animacy=Inan|Case=Gen|Number=Plur | лет, годов, гг. | |
Animacy=Inan|Case=Ins|Number=Sing | годом | |
Animacy=Inan|Case=Ins|Number=Plur | годами | |
Animacy=Inan|Case=Loc|Number=Sing | году, г. | |
Animacy=Inan|Case=Loc|Number=Plur | годах, гг., годы | |
Animacy=Inan|Case=Nom|Number=Sing | год, г. | |
Animacy=Inan|Case=Nom|Number=Plur | годы, гг. |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (6039) occur only with one value of Gender
.
ADJ
9543 ADJ tokens (78% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (9541; 100%), Degree=Pos (9485; 99%).
ADJ
tokens may have the following values of Gender
:
Fem
(2720; 29% of non-emptyGender
): второй, российской, первой, отечественной, большую, мировой, новой, центральной, северной, большаяMasc
(5073; 53% of non-emptyGender
): 2008, 2010, 2004, первый, 2012, 2006, 2011, 2007, 2009, 2001Neut
(1750; 18% of non-emptyGender
): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY
(2730): других, различных, многие, первые, самых, новые, первых, новых, известных, разных
Paradigm первый | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | первый | ||
Case=Acc | первую | первое | |
Case=Dat | первому | ||
Case=Gen | первого | первой | первого |
Case=Ins | первым | первой | первым |
Case=Loc | первом | первой | первом |
Case=Nom | первый | первая | первое |
PROPN
6584 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (6382; 97%), Animacy=Anim (3299; 50%).
PROPN
tokens may have the following values of Gender
:
Fem
(1842; 28% of non-emptyGender
): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc
(4523; 69% of non-emptyGender
): США, СССР, Александра, Владимир, Александр, Джон, КОАТУУ, Карл, Крыма, МихаилNeut
(219; 3% of non-emptyGender
): Дубно, Евровидение, Марокко, ЦРУ, IPO, Борисово, Григорово, Динамо, Домодедово, ЗакарпатьеEMPTY
(33): НЧ, В., 154М, 22М, 22Р, 25С, 3О, 400Т, 60К, 60Н
Paradigm НАТО | Masc | Fem | Neut |
---|---|---|---|
Case=Gen | НАТО | НАТО | НАТО |
Case=Nom | НАТО |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (4426) occur only with one value of Gender
.
VERB
3857 VERB tokens (45% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (3857; 100%), Person=EMPTY (3857; 100%), Tense=Past (3617; 94%), Variant=EMPTY (3106; 81%), Aspect=Perf (2627; 68%), Animacy=EMPTY (2452; 64%), Case=EMPTY (2451; 64%), Mood=Ind (2451; 64%), VerbForm=Fin (2451; 64%), Voice=Act (2153; 56%).
VERB
tokens may have the following values of Gender
:
Fem
(944; 24% of non-emptyGender
): стала, получила, основана, была, расположена, создана, вошла, появилась, вышла, род.Masc
(2308; 60% of non-emptyGender
): стал, получил, родился, начал, работал, окончил, назначен, участвовал, вышел, умерNeut
(605; 16% of non-emptyGender
): было, составляло, стало, удалось, принято, привело, расположено, пришлось, проживало, произошлоEMPTY
(4637): является, составляет, может, находится, входит, можно, имеет, есть, занимает, могут
Paradigm стать | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | ставшим | ||
Animacy=Anim|Case=Nom|VerbForm=Part|Voice=Act | ставший | ||
Animacy=Inan|Case=Nom|VerbForm=Part|Voice=Act | Ставшая | ||
Mood=Ind|VerbForm=Fin | стал | стала | стало |
Mood=Ind|VerbForm=Fin|Voice=Act | стал | стала | стало |
PRON
1428 PRON tokens (74% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1428; 100%), Person=EMPTY (792; 55%).
PRON
tokens may have the following values of Gender
:
Fem
(264; 18% of non-emptyGender
): она, которой, которая, ней, её, неё, которую, ей, нее, ееMasc
(647; 45% of non-emptyGender
): он, который, его, ему, которого, него, ним, котором, им, нёмNeut
(517; 36% of non-emptyGender
): это, того, что, тем, том, этом, то, этого, которое, всегоEMPTY
(490): которые, они, которых, себя, их, собой, них, я, им, мы
Paradigm который | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого, который | которую | |
Animacy=Anim|Case=Dat | которому | ||
Animacy=Anim|Case=Gen | которого | которой | |
Animacy=Anim|Case=Ins | которым | которой | |
Animacy=Anim|Case=Nom | который | которая | |
Animacy=Inan|Case=Acc | который | которую | которое, которого |
Animacy=Inan|Case=Dat | которому | которой | которому |
Animacy=Inan|Case=Gen | которого | которой | которого |
Animacy=Inan|Case=Ins | которым | которой | |
Animacy=Inan|Case=Loc | котором | которой | котором |
Animacy=Inan|Case=Nom | который | которая | которое |
Gender
seems to be lexical feature of PRON
. 94% lemmas (15) occur only with one value of Gender
.
DET
824 DET tokens (53% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (824; 100%), Animacy=EMPTY (729; 88%).
DET
tokens may have the following values of Gender
:
Fem
(251; 30% of non-emptyGender
): своей, свою, этой, эта, всей, эту, н., всю, каждая, каждойMasc
(327; 40% of non-emptyGender
): этот, этого, свой, этом, своего, тот, каждый, весь, том, своимNeut
(246; 30% of non-emptyGender
): то, это, том, этого, своё, свое, что, всё, своего, тогоEMPTY
(731): его, её, их, все, всех, некоторые, эти, этих, своих, свои
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Inan|Case=Acc | этот | ||
Case=Acc | эту | это | |
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой, это | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
NUM
607 NUM tokens (29% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (590; 97%), Animacy=Inan (493; 81%).
NUM
tokens may have the following values of Gender
:
Fem
(154; 25% of non-emptyGender
): одной, две, одна, двух, тыс., одну, 2, 1, обе, двумMasc
(423; 70% of non-emptyGender
): два, один, 2, 1, двух, одним, одного, 22, оба, 21Neut
(30; 5% of non-emptyGender
): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY
(1496): несколько, 10, 4, три, 3, 5, 6, 20, четыре, 16
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | одного | ||
Animacy=Anim|Case=Dat|Number=Sing | одному | ||
Animacy=Anim|Case=Gen|Number=Sing | одного | одного | |
Animacy=Anim|Case=Ins|Number=Sing | одним | одной | |
Animacy=Anim|Case=Nom|Number=Sing | один | одна | |
Animacy=Inan|Case=Acc|Number=Sing | один | одну | одно, одного |
Animacy=Inan|Case=Dat|Number=Sing | одному | одной | |
Animacy=Inan|Case=Gen|Number=Sing | одного | одной | одного |
Animacy=Inan|Case=Ins|Number=Sing | одним | одной | одним |
Animacy=Inan|Case=Loc|Number=Sing | одном | одной | одном |
Animacy=Inan|Case=Loc|Number=Plur | одних | ||
Animacy=Inan|Case=Nom|Number=Sing | один | одна | одно |
Gender
seems to be lexical feature of NUM
. 93% lemmas (125) occur only with one value of Gender
.
AUX
579 AUX tokens (72% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (579; 100%), Number=Sing (579; 100%), Tense=Past (579; 100%), Mood=Ind (577; 100%), VerbForm=Fin (577; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(135; 23% of non-emptyGender
): былаMasc
(315; 54% of non-emptyGender
): был, бывшего, бывшимNeut
(129; 22% of non-emptyGender
): былоEMPTY
(229): были, быть, будет, будучи, будут, бы, есть, бывшие
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
Mood=Ind|VerbForm=Fin | был | была | было |
Mood=Ind|VerbForm=Fin|Voice=Act | был | было |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7460; 76%),
NOUN –[conj]–> NOUN (1108; 55%),
PROPN –[flat:name]–> PROPN (964; 99%),
NOUN –[appos]–> PROPN (790; 69%),
NOUN –[det]–> DET (657; 51%),
NOUN –[acl]–> VERB (509; 53%),
VERB –[nsubj]–> PROPN (470; 69%),
VERB –[aux:pass]–> AUX (405; 95%),
NOUN –[appos]–> NOUN (404; 52%),
VERB –[nsubj:pass]–> NOUN (388; 71%).