Treebank Statistics: UD_Ukrainian-IU: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
50784 tokens (41%) have a non-empty value of Gender
.
23066 types (73%) occur at least once with a non-empty value of Gender
.
13003 lemmas (72%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (28890; 24% instances), ADJ (8213; 7% instances), VERB (3609; 3% instances), PROPN (3409; 3% instances), DET (2994; 2% instances), PRON (2770; 2% instances), AUX (482; 0% instances), NUM (406; 0% instances), X (11; 0% instances).
NOUN
28890 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (24711; 86%), Number=Sing (20762; 72%).
NOUN
tokens may have the following values of Gender
:
Fem
(11251; 39% of non-emptyGender
): людей, люди, мови, грн, області, землі, території, ради, роботи, тваринMasc
(12929; 45% of non-emptyGender
): час, року, %, років, часу, №, р, рік, чоловік, роціNeut
(4710; 16% of non-emptyGender
): життя, питання, слова, рішення, ст, використання, очі, місце, видання, населенняEMPTY
(481): грошей, даних, виборів, гроші, двері, дані, коштів, ЗМІ, даними, дверей
Paradigm голова | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | Голову | |
Animacy=Anim|Case=Dat|Number=Sing | голові | |
Animacy=Anim|Case=Gen|Number=Sing | голови | |
Animacy=Anim|Case=Gen|Number=Plur | голів | |
Animacy=Anim|Case=Ins|Number=Sing | головою | |
Animacy=Anim|Case=Ins|Number=Plur | головами | |
Animacy=Anim|Case=Nom|Number=Sing | голова | Голова |
Animacy=Inan|Case=Acc|Number=Sing | голову | |
Animacy=Inan|Case=Acc|Number=Plur | голови | |
Animacy=Inan|Case=Gen|Number=Sing | голови | |
Animacy=Inan|Case=Ins|Number=Sing | головою | |
Animacy=Inan|Case=Loc|Number=Sing | голові | |
Animacy=Inan|Case=Nom|Number=Sing | голова | |
Animacy=Inan|Case=Nom|Number=Plur | голови |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (6895) occur only with one value of Gender
.
ADJ
8213 ADJ tokens (68% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (8213; 100%), Animacy=EMPTY (7662; 93%), Aspect=EMPTY (7460; 91%), VerbForm=EMPTY (7460; 91%), Voice=EMPTY (7460; 91%), Degree=EMPTY (5870; 71%).
ADJ
tokens may have the following values of Gender
:
Fem
(3402; 41% of non-emptyGender
): української, державної, національної, українська, великої, Тернопільської, нову, верховної, нова, цілуMasc
(3381; 41% of non-emptyGender
): 2017, 2016, українського, перший, український, цілий, першого, 2015, новий, новогоNeut
(1430; 17% of non-emptyGender
): ціле, 27, 1, XI, нове, 3, 15, 23, 25, державногоEMPTY
(3852): різних, українських, перших, різні, нових, нові, місцевих, перші, повинні, великі
Paradigm український | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | український | ||
Case=Acc | українську | українське | |
Case=Dat | українському | українській | Українському |
Case=Gen | українського | української | українського |
Case=Ins | українським | українською | |
Case=Loc | українському | українській | українському |
Case=Nom | український | українська | українське |
VERB
3609 VERB tokens (28% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=Ind (3609; 100%), Number=Sing (3609; 100%), Person=EMPTY (3609; 100%), Tense=Past (3609; 100%), VerbForm=Fin (3609; 100%), Aspect=Perf (1963; 54%).
VERB
tokens may have the following values of Gender
:
Fem
(1098; 30% of non-emptyGender
): була, стала, стояла, мала, знала, зробила, любила, казала, могла, почалаMasc
(1980; 55% of non-emptyGender
): мав, міг, був, сказав, почав, знав, став, хотів, бачив, пішовNeut
(531; 15% of non-emptyGender
): було, стало, виявилося, вдалося, довелося, здавалося, могло, вийшло, хотілося, відбулосяEMPTY
(9292): є, може, має, каже, немає, можуть, мають, були, мали, нема
Paradigm бути | Masc | Fem | Neut |
---|---|---|---|
був | була | було |
PROPN
3409 PROPN tokens (97% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (3386; 99%), Uninflect=EMPTY (2902; 85%), Animacy=Anim (2010; 59%).
PROPN
tokens may have the following values of Gender
:
Fem
(1263; 37% of non-emptyGender
): україни, Україні, Україна, Міра, Росії, Марія, Мотря, Європи, Ради, ЄвропіMasc
(2052; 60% of non-emptyGender
): київ, Києва, Вінстон, Гнат, Києві, Михась, О, ХАІ, Андрій, ЛьвовіNeut
(94; 3% of non-emptyGender
): Закарпаття, Вапліте, Полісся, Сан-Ремо, Токіо, 3G, ЄС, Євро, Дзвонкове, ЗакарпаттіEMPTY
(114): США, в, б, А, Карпати, Черкаси, Карпат, д, с, і
Paradigm І. | Masc | Fem |
---|---|---|
Case=Acc|NameType=Giv | І | |
Case=Gen|NameType=Giv | І | |
Case=Gen|NameType=Pat | І | |
Case=Nom|NameType=Giv | І | І |
Case=Nom|NameType=Pat | І |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (1519) occur only with one value of Gender
.
DET
2994 DET tokens (64% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (2994; 100%), Animacy=EMPTY (2671; 89%), Reflex=EMPTY (2601; 87%), Person=EMPTY (2432; 81%), Poss=EMPTY (2163; 72%).
DET
tokens may have the following values of Gender
:
Fem
(1133; 38% of non-emptyGender
): яка, його, свою, ця, яку, цю, сама, така, цій, цієїMasc
(1365; 46% of non-emptyGender
): який, той, цей, цього, один, його, сам, свій, свого, тогоNeut
(496; 17% of non-emptyGender
): його, все, таке, яке, своє, це, одне, цього, її, томуEMPTY
(1678): які, всі, кілька, інших, ці, яких, ті, всіх, багато, такі
Paradigm який | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|PronType=Rel | якого | ||
Animacy=Inan|Case=Acc|PronType=Ind | який | ||
Animacy=Inan|Case=Acc|PronType=Int | який | ||
Animacy=Inan|Case=Acc|PronType=Rel | який | ||
Case=Acc|PronType=Rel | яку | яке | |
Case=Dat|PronType=Rel | якому | якій | |
Case=Gen|PronType=Ind | будь-якої | ||
Case=Gen|PronType=Int | Якого | якої | |
Case=Gen|PronType=Rel | якого | якої | якого |
Case=Ins|PronType=Ind | яким | ||
Case=Ins|PronType=Rel | яким | якою | яким |
Case=Loc|PronType=Ind | якій | ||
Case=Loc|PronType=Rel | якому | якій | якому |
Case=Nom|PronType=Ind | який | яка | |
Case=Nom|PronType=Int | яка | ||
Case=Nom|PronType=Rel | який | яка | яке |
PRON
2770 PRON tokens (55% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (2770; 100%), Animacy=EMPTY (1386; 50%), Person=3 (1386; 50%), PronType=Prs (1386; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(474; 17% of non-emptyGender
): вона, її, неї, їй, ній, неюMasc
(935; 34% of non-emptyGender
): він, його, йому, хто, нього, ним, кого, кому, ньому, кимNeut
(1361; 49% of non-emptyGender
): це, що, те, того, все, щось, воно, його, цього, чогоEMPTY
(2304): я, ми, вони, їх, мене, нас, ви, мені, ти, них
Gender
seems to be lexical feature of PRON
. 100% lemmas (22) occur only with one value of Gender
.
AUX
482 AUX tokens (46% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (482; 100%), Mood=Ind (482; 100%), Number=Sing (482; 100%), Person=EMPTY (482; 100%), Tense=Past (482; 100%), VerbForm=Fin (482; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(108; 22% of non-emptyGender
): булаMasc
(142; 29% of non-emptyGender
): бувNeut
(232; 48% of non-emptyGender
): було, бувалоEMPTY
(576): є, були, буде, бути, б, би, будуть, будемо, буду, будете
Paradigm бути | Masc | Fem | Neut |
---|---|---|---|
був | була | було |
NUM
406 NUM tokens (23% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (406; 100%), Case=Nom (210; 52%), Uninflect=EMPTY (209; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(91; 22% of non-emptyGender
): дві, двох, одну, одна, обидві, 2, 1, двома, 22, однійMasc
(287; 71% of non-emptyGender
): 1, 2, два, один, двох, обидва, одного, півтора, 21, 32Neut
(28; 7% of non-emptyGender
): одне, двох, одним, 1, два, Одно, одному, 2, 21, одногоEMPTY
(1359): 5, 3, 7, три, 4, 6, 10, 8, 2, пів
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | два, двох | дві, двох | два |
Case=Gen | двох | двох | двох |
Case=Ins | двома | двома | |
Case=Loc | двох | двох | |
Case=Nom | два | дві | два |
X
11 X tokens (2% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Foreign=Yes (11; 100%).
X
tokens may have the following values of Gender
:
Fem
(5; 45% of non-emptyGender
): Снарская, блядєй, системы, строгой, частєйMasc
(4; 36% of non-emptyGender
): GMAT, Kapital’у, дождєй, факінґNeut
(2; 18% of non-emptyGender
): крушеніє, местоEMPTY
(591): Office, the, Windows, Amazon, DITIB, cyanus, Centaurea, GFP, mneme, n
Gender
seems to be lexical feature of X
. 100% lemmas (11) occur only with one value of Gender
.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6486; 69%),
NOUN –[det]–> DET (2072; 69%),
PROPN –[flat:name]–> PROPN (530; 100%),
VERB –[conj]–> VERB (481; 64%),
ADJ –[conj]–> ADJ (382; 96%),
NOUN –[flat:title]–> PROPN (364; 76%),
ADJ –[nsubj]–> NOUN (317; 64%),
VERB –[nsubj]–> PROPN (294; 65%),
NOUN –[appos]–> NOUN (277; 57%),
PROPN –[conj]–> PROPN (149; 76%).