Treebank Statistics: UD_Polish-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
10147 tokens (55%) have a non-empty value of Gender
.
6790 types (90%) occur at least once with a non-empty value of Gender
.
4455 lemmas (89%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (4481; 24% instances), ADJ (2343; 13% instances), PROPN (1348; 7% instances), VERB (765; 4% instances), DET (510; 3% instances), PRON (357; 2% instances), NUM (182; 1% instances), AUX (161; 1% instances).
NOUN
4481 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (3210; 72%), Animacy=EMPTY (2467; 55%).
NOUN
tokens may have the following values of Gender
:
Fem
(1548; 35% of non-emptyGender
): części, wojny, większość, osób, pracy, część, linii, ochrony, uwagę, historiiMasc
(2014; 45% of non-emptyGender
): lat, roku, latach, ludzi, raz, wieku, świecie, czasów, dolarów, funtówNeut
(919; 21% of non-emptyGender
): miejsce, miasta, euro, danych, miejscu, prawa, życia, badania, działania, miejscaEMPTY
(165): r, %, p.n.e, w, mld, n.e, °C, dr, mln, tys
Paradigm państwo | Masc | Neut |
---|---|---|
Animacy=Hum|Case=Nom|Number=Ptan | państwo | |
Case=Acc|Number=Sing | państwo | |
Case=Dat|Number=Sing | państwu | |
Case=Gen|Number=Sing | państwa | |
Case=Nom|Number=Sing | państwo | |
Case=Nom|Number=Plur | państwa |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (1920) occur only with one value of Gender
.
ADJ
2343 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Aspect=EMPTY (1932; 82%), Polarity=EMPTY (1932; 82%), VerbForm=EMPTY (1932; 82%), Voice=EMPTY (1932; 82%), Degree=Pos (1852; 79%), Number=Sing (1641; 70%), Animacy=EMPTY (1187; 51%).
ADJ
tokens may have the following values of Gender
:
Fem
(804; 34% of non-emptyGender
): wielkiej, dużą, północna, I, Północnej, brytyjskiej, drugiej, dużej, jednej, pierwszejMasc
(1156; 49% of non-emptyGender
): 1, jednym, ostatnich, pierwszy, II, jeden, 60, I, III, nowegoNeut
(383; 16% of non-emptyGender
): pierwsze, Zjednoczonych, bezpośrednie, całe, duże, greckie, inne, małe, olimpijskich, CeltyckimEMPTY
(18): północno, św, gotów, południowo, prostu, angielsku, austriacko, francusko, męsku, niedawna
Paradigm duży | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing | duży | ||
Animacy=Inan|Case=Acc|Degree=Sup|Number=Sing | największy | ||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur | dużych | ||
Animacy=Inan|Case=Gen|Degree=Cmp|Number=Sing | większego | ||
Animacy=Inan|Case=Ins|Degree=Sup|Number=Sing | największym | ||
Animacy=Inan|Case=Ins|Degree=Sup|Number=Plur | największymi | ||
Animacy=Inan|Case=Loc|Degree=Cmp|Number=Sing | większym | ||
Animacy=Inan|Case=Loc|Degree=Sup|Number=Sing | największym | ||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing | duży | ||
Animacy=Inan|Case=Nom|Degree=Cmp|Number=Sing | większy | ||
Animacy=Inan|Case=Nom|Degree=Sup|Number=Sing | Największy | ||
Case=Acc|Degree=Pos|Number=Sing | dużą | duże | |
Case=Acc|Degree=Pos|Number=Plur | duże | ||
Case=Acc|Degree=Cmp|Number=Sing | większą | ||
Case=Acc|Degree=Cmp|Number=Plur | większe | ||
Case=Dat|Degree=Pos|Number=Sing | dużej | ||
Case=Gen|Degree=Pos|Number=Sing | dużej | ||
Case=Gen|Degree=Pos|Number=Plur | dużych | ||
Case=Gen|Degree=Cmp|Number=Sing | większej | ||
Case=Gen|Degree=Cmp|Number=Plur | większych | ||
Case=Gen|Degree=Sup|Number=Sing | największej | ||
Case=Ins|Degree=Pos|Number=Sing | dużą | ||
Case=Ins|Degree=Cmp|Number=Sing | większą | ||
Case=Ins|Degree=Sup|Number=Sing | największym | ||
Case=Loc|Degree=Pos|Number=Sing | dużej | ||
Case=Loc|Degree=Cmp|Number=Plur | większych | ||
Case=Nom|Degree=Pos|Number=Sing | duża | ||
Case=Nom|Degree=Cmp|Number=Sing | większa |
PROPN
1348 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (1229; 91%).
PROPN
tokens may have the following values of Gender
:
Fem
(343; 25% of non-emptyGender
): Brytanii, Clinton, Azji, Europy, Francji, Kesha, Rosji, Ziemi, Albanii, AmerykiMasc
(762; 57% of non-emptyGender
): Trumpa, Hongkongu, Pekinu, Qing, American, Chińczyków, Disneya, Joseph, Mishima, TotmesaNeut
(243; 18% of non-emptyGender
): USA, Morze, Chiny, BBC, Danevirke, Ontario, Chinach, Morza, Morzu, NiemcyEMPTY
(1): Z
Paradigm Trump | Masc | Fem |
---|---|---|
Animacy=Hum|Case=Acc | Trumpa | |
Animacy=Hum|Case=Dat | Trumpowi | |
Animacy=Hum|Case=Gen | Trumpa | |
Animacy=Hum|Case=Ins | Trumpem | |
Animacy=Hum|Case=Nom | Trump | |
Case=Nom | Trump |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (948) occur only with one value of Gender
.
VERB
765 VERB tokens (47% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=Ind (765; 100%), Person=EMPTY (765; 100%), VerbForm=Fin (765; 100%), Voice=Act (765; 100%), Tense=Past (761; 99%), Number=Sing (598; 78%), Aspect=Perf (494; 65%).
VERB
tokens may have the following values of Gender
:
Fem
(202; 26% of non-emptyGender
): miała, powiedziała, dotarła, mogła, stała, miały, ogłosiła, spowodowała, ujawniła, uznałaMasc
(440; 58% of non-emptyGender
): powiedział, miał, napisał, ogłosił, pracował, spotkał, miały, mógł, postanowił, uznałNeut
(123; 16% of non-emptyGender
): było, udało, stało, dostało, mogło, odbyło, przyczyniło, rozpoczęło, skutkowało, spowodowałoEMPTY
(863): może, ma, mogą, można, jest, mówi, być, należy, znajduje, zrobić
Paradigm móc | Masc | Fem | Neut |
---|---|---|---|
Animacy=Hum|Number=Sing | mógł | ||
Animacy=Inan|Number=Plur | mogły | ||
Number=Sing | mogła | mogło | |
Number=Plur | mogły |
DET
510 DET tokens (100% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Reflex=EMPTY (445; 87%), Poss=EMPTY (430; 84%), Number=Sing (282; 55%).
DET
tokens may have the following values of Gender
:
Fem
(175; 34% of non-emptyGender
): która, swojej, które, ta, tej, więcej, swoją, której, takich, jakąMasc
(258; 51% of non-emptyGender
): który, tym, ten, którzy, tego, każdy, którego, które, tych, wieluNeut
(77; 15% of non-emptyGender
): które, wiele, takie, tych, których, swoim, swoje, to, więcej, swojego
Paradigm który | Masc | Fem | Neut |
---|---|---|---|
Animacy=Hum|Case=Acc|Number=Sing|PronType=Rel | którego | ||
Animacy=Hum|Case=Acc|Number=Plur|PronType=Rel | których | ||
Animacy=Hum|Case=Dat|Number=Plur|PronType=Rel | którym | ||
Animacy=Hum|Case=Gen|Number=Sing|PronType=Rel | którego | ||
Animacy=Hum|Case=Gen|Number=Plur|PronType=Rel | których | ||
Animacy=Hum|Case=Nom|Number=Sing|PronType=Rel | który | ||
Animacy=Hum|Case=Nom|Number=Plur|PronType=Rel | którzy | ||
Animacy=Inan|Case=Acc|Number=Sing|PronType=Int | który | ||
Animacy=Inan|Case=Acc|Number=Plur|PronType=Rel | które | ||
Animacy=Inan|Case=Dat|Number=Sing|PronType=Rel | któremu | ||
Animacy=Inan|Case=Gen|Number=Sing|PronType=Rel | którego | ||
Animacy=Inan|Case=Gen|Number=Plur|PronType=Rel | których | ||
Animacy=Inan|Case=Loc|Number=Sing|PronType=Rel | którym | ||
Animacy=Inan|Case=Nom|Number=Sing|PronType=Rel | który | ||
Animacy=Inan|Case=Nom|Number=Plur|PronType=Rel | które | ||
Animacy=Nhum|Case=Nom|Number=Sing|PronType=Rel | który | ||
Case=Acc|Number=Sing|PronType=Rel | które | ||
Case=Acc|Number=Plur|PronType=Int | które | ||
Case=Acc|Number=Plur|PronType=Rel | które | ||
Case=Gen|Number=Sing|PronType=Rel | której | którego | |
Case=Gen|Number=Plur|PronType=Rel | których | których | |
Case=Ins|Number=Sing|PronType=Rel | którą | ||
Case=Loc|Number=Sing|PronType=Rel | której | którym | |
Case=Loc|Number=Plur|PronType=Rel | których | ||
Case=Nom|Number=Sing|PronType=Rel | która | które | |
Case=Nom|Number=Plur|PronType=Rel | które | które |
PRON
357 PRON tokens (56% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (357; 100%), Number=Sing (298; 83%), PronType=Prs (226; 63%), Person=3 (208; 58%), Animacy=EMPTY (196; 55%), Variant=Long (190; 53%), PrepCase=Npr (184; 52%).
PRON
tokens may have the following values of Gender
:
Fem
(66; 18% of non-emptyGender
): jej, ją, ona, niej, ich, nich, Ja, je, niąMasc
(161; 45% of non-emptyGender
): jego, ich, go, mu, ktoś, im, nich, niego, ja, ktoNeut
(130; 36% of non-emptyGender
): to, tym, co, tego, coś, je, temu, czym, ich, jegoEMPTY
(282): się, siebie, sobie
Paradigm on | Masc | Fem | Neut |
---|---|---|---|
Animacy=Hum|Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
Animacy=Hum|Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
Animacy=Hum|Case=Dat|Number=Sing|PrepCase=Npr|Variant=Short | mu | ||
Animacy=Hum|Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | ||
Animacy=Hum|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego | ||
Animacy=Hum|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ||
Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
Animacy=Hum|Case=Ins|Number=Sing|PrepCase=Npr|Variant=Long | nim | ||
Animacy=Hum|Case=Ins|Number=Sing|PrepCase=Pre|Variant=Long | nim | ||
Animacy=Hum|Case=Ins|Number=Plur|PrepCase=Pre|Variant=Long | nimi | ||
Animacy=Hum|Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | nim | ||
Animacy=Hum|Case=Loc|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
Animacy=Hum|Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ||
Animacy=Hum|Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | oni | ||
Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | ich, je | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Short | ń | ||
Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ||
Animacy=Inan|Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ||
Animacy=Inan|Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | one | ||
Case=Acc|Number=Sing|PrepCase=Npr|Variant=Long | ją | je | |
Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | nią | ||
Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | je | je | |
Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nie | ||
Case=Dat|Number=Sing|PrepCase=Npr|Variant=Long | jej | ||
Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | ||
Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jej | jego | |
Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niej | niego | |
Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ich | |
Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | niej | ||
Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | ona | ||
Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | one |
NUM
182 NUM tokens (100% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Plur (178; 98%), Animacy=Inan (112; 62%), NumForm=Digit (100; 55%), NumType=Card (100; 55%).
NUM
tokens may have the following values of Gender
:
Fem
(24; 13% of non-emptyGender
): dwie, czterech, dwiema, dwóch, sześć, trzy, 168000, 328, 330000, 45Masc
(145; 80% of non-emptyGender
): dwa, dwóch, 3, trzy, 5, 1,5, 10, 100, 2, 20Neut
(13; 7% of non-emptyGender
): 1.335, 1.365, 100, 34, 35000, 500, Trzy, cztery, dwa, dwóch
Paradigm dwa | Masc | Fem | Neut |
---|---|---|---|
Animacy=Hum|Case=Acc | dwóch | ||
Animacy=Hum|Case=Gen | dwóch | ||
Animacy=Hum|Case=Nom | dwaj, Dwóch | ||
Animacy=Inan|Case=Acc | dwa | ||
Animacy=Inan|Case=Gen | dwóch | ||
Animacy=Inan|Case=Ins | dwoma | ||
Animacy=Inan|Case=Loc | dwóch | ||
Animacy=Inan|Case=Nom | dwa | ||
Case=Acc | dwie | ||
Case=Gen | dwóch | dwóch | |
Case=Ins | dwiema | ||
Case=Loc | dwóch | ||
Case=Nom | dwa |
AUX
161 AUX tokens (35% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Mood=Ind (161; 100%), Person=EMPTY (161; 100%), Tense=Past (161; 100%), VerbForm=Fin (161; 100%), Voice=Act (161; 100%), Number=Sing (122; 76%), Aspect=Imp (91; 57%).
AUX
tokens may have the following values of Gender
:
Fem
(42; 26% of non-emptyGender
): była, została, zostały, byłyMasc
(84; 52% of non-emptyGender
): był, został, byli, były, zostali, zostałyNeut
(35; 22% of non-emptyGender
): było, zostało, zostały, byłyEMPTY
(299): jest, to, są, by, będzie, em, być, będą, m, śmy
Paradigm być | Masc | Fem | Neut |
---|---|---|---|
Animacy=Hum|Number=Sing | był | ||
Animacy=Hum|Number=Plur | byli | ||
Animacy=Inan|Number=Sing | był | ||
Animacy=Inan|Number=Plur | były | ||
Number=Sing | była | było | |
Number=Plur | były | były |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (1333; 99%),
VERB –[nsubj]–> NOUN (273; 53%),
NOUN –[acl]–> ADJ (226; 98%),
PROPN –[flat]–> PROPN (192; 93%),
NOUN –[det]–> DET (188; 98%),
VERB –[nsubj]–> PROPN (167; 76%),
ADJ –[aux:pass]–> AUX (91; 65%),
PROPN –[amod:flat]–> ADJ (89; 100%),
NOUN –[det:poss]–> DET (80; 100%),
ADJ –[nsubj:pass]–> NOUN (77; 97%).