Treebank Statistics: UD_Croatian-SET: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
100308 tokens (50%) have a non-empty value of Gender
.
32347 types (91%) occur at least once with a non-empty value of Gender
.
15628 lemmas (84%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (48386; 24% instances), ADJ (22932; 11% instances), PROPN (12825; 6% instances), DET (7332; 4% instances), VERB (6090; 3% instances), PRON (1517; 1% instances), AUX (615; 0% instances), NUM (611; 0% instances).
NOUN
48386 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (34528; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(18902; 39% of non-emptyGender
): godine, godina, zemlje, kuna, zemalja, stranke, država, strane, vlada, vlastiMasc
(22135; 46% of non-emptyGender
): milijuna, eura, ljudi, dana, predsjednik, poslova, način, ministar, dio, ponedjeljakNeut
(7349; 15% of non-emptyGender
): vrijeme, mjesto, prava, pitanje, mjesta, pitanja, ulaganja, rješenje, članstvo, područjuEMPTY
(191): dr., kg, GB, prof., m, km, g., kn, cm, mil.
Paradigm kuna | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | kunu | |
Case=Acc|Number=Plur | kune | |
Case=Gen|Number=Sing | kune | |
Case=Gen|Number=Plur | kuna | kuna |
Case=Nom|Number=Plur | kune |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (6346) occur only with one value of Gender
.
ADJ
22932 ADJ tokens (95% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Degree=Pos (21824; 95%), Definite=Def (20684; 90%), Number=Sing (15101; 66%).
ADJ
tokens may have the following values of Gender
:
Fem
(8979; 39% of non-emptyGender
): prošle, hrvatske, druge, sve, nove, europske, prva, nova, novu, političkeMasc
(10552; 46% of non-emptyGender
): novi, prvi, drugi, svi, vanjskih, glavni, hrvatski, bivši, najveći, novogNeut
(3401; 15% of non-emptyGender
): moguće, potrebno, važno, dobro, drugo, prvo, internetskog, ljudskih, pravo, radnihEMPTY
(1207): 1., 2004., 2008., 2007., 2009., 2006., 2., 2005., 2010., 21.
Paradigm velik | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc|Definite=Def|Degree=Pos|Number=Sing | veliki | ||
Animacy=Inan|Case=Acc|Definite=Def|Degree=Cmp|Number=Sing | veći | ||
Animacy=Inan|Case=Acc|Definite=Def|Degree=Sup|Number=Sing | najveći | ||
Animacy=Inan|Case=Acc|Definite=Ind|Degree=Pos|Number=Sing | velik, veći | ||
Case=Acc|Definite=Def|Degree=Pos|Number=Sing | veliku | ||
Case=Acc|Definite=Def|Degree=Pos|Number=Plur | velike | velike | veća |
Case=Acc|Definite=Def|Degree=Cmp|Number=Sing | veću | veće | |
Case=Acc|Definite=Def|Degree=Cmp|Number=Plur | veće | veće | |
Case=Acc|Definite=Def|Degree=Sup|Number=Sing | najveću | najveće | |
Case=Acc|Definite=Def|Degree=Sup|Number=Plur | najveće | najveća | |
Case=Dat|Definite=Def|Degree=Pos|Number=Sing | velikom | velikoj | |
Case=Dat|Definite=Def|Degree=Pos|Number=Plur | velikim | ||
Case=Dat|Definite=Def|Degree=Cmp|Number=Sing | većoj | ||
Case=Dat|Definite=Def|Degree=Sup|Number=Sing | najvećem | najvećim | |
Case=Dat|Definite=Def|Degree=Sup|Number=Plur | najvećim | ||
Case=Gen|Definite=Def|Degree=Pos|Number=Sing | velikog, velika, velikoga | velike | velikog, najvećeg |
Case=Gen|Definite=Def|Degree=Pos|Number=Plur | velikih | velikih | velikih |
Case=Gen|Definite=Def|Degree=Cmp|Number=Sing | većeg | veće | većeg |
Case=Gen|Definite=Def|Degree=Cmp|Number=Plur | većih | većih | |
Case=Gen|Definite=Def|Degree=Sup|Number=Sing | najvećeg, najveća | najveće | |
Case=Gen|Definite=Def|Degree=Sup|Number=Plur | najvećih | najvećih | najvećih |
Case=Ins|Definite=Def|Degree=Pos|Number=Sing | velikim | velikom | najvećim |
Case=Ins|Definite=Def|Degree=Pos|Number=Plur | velikim | velikim | |
Case=Ins|Definite=Def|Degree=Cmp|Number=Sing | većim | većom | |
Case=Ins|Definite=Def|Degree=Cmp|Number=Plur | većim | ||
Case=Ins|Definite=Def|Degree=Sup|Number=Sing | najvećim | najvećom | |
Case=Ins|Definite=Def|Degree=Sup|Number=Plur | najvećim | najvećima | |
Case=Loc|Definite=Def|Degree=Pos|Number=Sing | velikom | velikoj | velikom |
Case=Loc|Definite=Def|Degree=Pos|Number=Plur | velikim | velikim | velikim |
Case=Loc|Definite=Def|Degree=Cmp|Number=Sing | većem | većoj | |
Case=Loc|Definite=Def|Degree=Sup|Number=Sing | najvećem | najvećoj | |
Case=Loc|Definite=Def|Degree=Sup|Number=Plur | najvećim | ||
Case=Nom|Definite=Def|Degree=Pos|Number=Sing | veliki | velika | veliko |
Case=Nom|Definite=Def|Degree=Pos|Number=Plur | veliki | velike | velika |
Case=Nom|Definite=Def|Degree=Cmp|Number=Sing | veći | veća | veće |
Case=Nom|Definite=Def|Degree=Cmp|Number=Plur | veća | ||
Case=Nom|Definite=Def|Degree=Sup|Number=Sing | najveći | najveća | najveće |
Case=Nom|Definite=Def|Degree=Sup|Number=Plur | najveći | najveće | najveća |
Case=Nom|Definite=Ind|Degree=Pos|Number=Sing | velik |
PROPN
12825 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (12511; 98%), Case=Nom (6511; 51%).
PROPN
tokens may have the following values of Gender
:
Fem
(4062; 32% of non-emptyGender
): BiH, Hrvatskoj, Srbije, Hrvatska, Srbija, Hrvatske, Europe, Srbiji, Makedonija, TurskeMasc
(8339; 65% of non-emptyGender
): EU, SETimes, UN-a, Windows, Beogradu, NATO-u, NATO-a, Bog, Zagrebu, ZagrebNeut
(424; 3% of non-emptyGender
): Kosova, Kosovo, Kosovu, Sarajevu, Skoplju, Kosovom, Skoplja, Skoplje, Jarinje, SarajevoEMPTY
(23): R., AMG, B, R, B.o.B., BamS, DI, EBEL, EL, G.
Paradigm BiH | Masc | Fem |
---|---|---|
Case=Acc | BiH | |
Case=Dat | BiH | |
Case=Gen | BiH | BiH, BIH |
Case=Loc | BiH | BiH |
Case=Nom | BiH |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (4245) occur only with one value of Gender
.
DET
7332 DET tokens (95% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (6503; 89%), Person=EMPTY (6503; 89%), Poss=EMPTY (5750; 78%), Number=Sing (5100; 70%).
DET
tokens may have the following values of Gender
:
Fem
(2431; 33% of non-emptyGender
): koje, koja, ove, koju, kojoj, svoje, svoju, te, ta, kojimaMasc
(3102; 42% of non-emptyGender
): koji, svoj, taj, neki, koje, ovaj, ovog, kojem, kojim, kojimaNeut
(1799; 25% of non-emptyGender
): to, toga, koje, tome, sve, ovo, koja, svoje, time, timEMPTY
(362): nekoliko, više, mnogo, pola, puno, posto, manje, malo, koliko, toliko
Paradigm koji | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | kojeg, kojega | ||
Animacy=Inan|Case=Acc|Number=Sing | koji | ||
Case=Acc|Number=Sing | koju | koje | |
Case=Acc|Number=Plur | koje | koje | koja |
Case=Dat|Number=Sing | kojemu, kojem | kojoj | kojem, kojemu |
Case=Dat|Number=Plur | kojima | kojima | kojima |
Case=Gen|Number=Sing | kojeg, kojega | koje | kojeg, kojega |
Case=Gen|Number=Plur | kojih | kojih | kojih |
Case=Ins|Number=Sing | kojim | kojom | kojim |
Case=Ins|Number=Plur | kojima | kojima | kojima |
Case=Loc|Number=Sing | kojem, kojemu, kom | kojoj | kojem, kojemu |
Case=Loc|Number=Plur | kojima, kojim | kojima, kojim | kojima |
Case=Nom|Number=Sing | koji | koja | koje |
Case=Nom|Number=Plur | koji | koje | koja |
VERB
6090 VERB tokens (35% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (6090; 100%), Person=EMPTY (6090; 100%), Tense=Past (6090; 100%), VerbForm=Part (6090; 100%), Voice=Act (6090; 100%), Number=Sing (4412; 72%).
VERB
tokens may have the following values of Gender
:
Fem
(1710; 28% of non-emptyGender
): mogla, trebala, izjavila, dobila, priopćila, rekla, postala, imala, kazala, objavilaMasc
(3835; 63% of non-emptyGender
): izjavio, rekao, kazao, mogli, dodao, mogao, dobili, trebao, trebali, imaliNeut
(545; 9% of non-emptyGender
): moglo, trebalo, došlo, pokazalo, dogodilo, omogućilo, ostalo, dovelo, počelo, prošloEMPTY
(11297): može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
Paradigm moći | Masc | Fem | Neut |
---|---|---|---|
Number=Sing | mogao | mogla | moglo |
Number=Plur | mogli | mogle | mogla |
PRON
1517 PRON tokens (29% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (1517; 100%), Person=EMPTY (815; 54%), Number=EMPTY (814; 54%), Case=Nom (772; 51%).
PRON
tokens may have the following values of Gender
:
Fem
(211; 14% of non-emptyGender
): ona, joj, je, ju, one, nje, njom, nju, njoj, njomeMasc
(583; 38% of non-emptyGender
): ga, mu, on, oni, tko, nitko, njega, njemu, netko, svatkoNeut
(723; 48% of non-emptyGender
): što, ništa, nešto, ono, čime, čega, čemu, ona, išta, nečemuEMPTY
(3785): se, ih, mi, im, njih, nam, vam, nas, ja, njima
Paradigm on | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | ga, njega | je, ju, nju | ga, nj, njega, ono |
Case=Dat | mu, njemu | joj, njoj | |
Case=Gen | njega | nje, je | |
Case=Ins | njim, njime | njom, njome | njime, njim |
Case=Loc | njemu | njoj | |
Case=Nom | on | ona | ono |
AUX
615 AUX tokens (5% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Mood=EMPTY (615; 100%), Person=EMPTY (615; 100%), Tense=Past (615; 100%), VerbForm=Part (615; 100%), Number=Sing (489; 80%).
AUX
tokens may have the following values of Gender
:
Fem
(169; 27% of non-emptyGender
): bila, bileMasc
(280; 46% of non-emptyGender
): bio, biliNeut
(166; 27% of non-emptyGender
): bilo, bilaEMPTY
(11951): je, su, će, bi, biti, nije, smo, sam, neće, nisu
Paradigm biti | Masc | Fem | Neut |
---|---|---|---|
Number=Sing | bio | bila | bilo |
Number=Plur | bili | bile | bila |
NUM
611 NUM tokens (19% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (576; 94%), Number=Sing (433; 71%), Case=Nom (322; 53%).
NUM
tokens may have the following values of Gender
:
Fem
(288; 47% of non-emptyGender
): dvije, jedna, jednu, dviju, jedne, obje, jednoj, jednom, obiju, objemaMasc
(292; 48% of non-emptyGender
): jedan, jednog, jednom, jednim, jedni, oba, dvaju, dvama, obaju, DvaNeut
(31; 5% of non-emptyGender
): jedno, jednog, jednom, Dvoje, Oba, dva, dvoja, jednogaEMPTY
(2537): tri, dva, pet, četiri, 20, 10, šest, deset, 15, 100
Paradigm jedan | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | jednog | ||
Animacy=Inan|Case=Acc|Number=Sing | jedan | ||
Case=Acc|Number=Sing | jednu | jedno | |
Case=Dat|Number=Sing | jednoj | ||
Case=Gen|Number=Sing | jednog | jedne | jednog, jednoga |
Case=Ins|Number=Sing | jednim | jednom | |
Case=Loc|Number=Sing | jednom, jednome | jednoj | jednom |
Case=Nom|Number=Sing | jedan | jedna | jedno |
Case=Nom|Number=Plur | jedni |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (17174; 95%),
NOUN –[det]–> DET (3190; 98%),
PROPN –[flat]–> PROPN (2331; 97%),
ADJ –[nsubj]–> NOUN (1448; 93%),
NOUN –[flat]–> PROPN (1334; 75%),
VERB –[nsubj]–> PROPN (1131; 57%),
ADJ –[conj]–> ADJ (774; 94%),
PROPN –[conj]–> PROPN (726; 75%),
NOUN –[acl]–> ADJ (677; 85%),
VERB –[conj]–> VERB (413; 54%).