Treebank Statistics: UD_Czech-CAC: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
287030 tokens (58%) have a non-empty value of Number
.
63357 types (101%) occur at least once with a non-empty value of Number
.
25934 lemmas (91%) occur at least once with a non-empty value of Number
.
The feature is used with 8 part-of-speech tags: NOUN (135048; 27% instances), ADJ (73929; 15% instances), VERB (31221; 6% instances), DET (17097; 3% instances), AUX (13688; 3% instances), PROPN (7869; 2% instances), PRON (5707; 1% instances), NUM (2471; 0% instances).
NOUN
135048 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Animacy=EMPTY (79164; 59%).
NOUN
tokens may have the following values of Number
:
Dual
(25; 0% of non-emptyNumber
): očima, rukama, nohama, ušimaPlur
(39714; 29% of non-emptyNumber
): let, pracovníků, úkolů, výsledky, lidí, úkoly, podmínky, letech, lidé, práceSing
(95309; 71% of non-emptyNumber
): práce, roce, práci, roku, době, společnosti, oblasti, hlediska, činnosti, výrobyEMPTY
(1135): ÚV, ZV, ZO, JZD, Kčs, ONV, ÚR, MěstNV, BSP, BP
Paradigm ruka | Sing | Dual | Plur |
---|---|---|---|
Case=Acc | ruku | ruce | |
Case=Dat | ruce | ||
Case=Gen | ruky | rukou | |
Case=Ins | rukou | rukama | |
Case=Loc | ruce | rukou, rukách | |
Case=Nom | ruka | ruce |
ADJ
73929 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (71064; 96%), Degree=Pos (67612; 91%), VerbForm=EMPTY (61736; 84%), Voice=EMPTY (61736; 84%), Animacy=EMPTY (44966; 61%).
ADJ
tokens may have the following values of Number
:
Dual
(7; 0% of non-emptyNumber
): holýma, jinýma, otevřenýma, plnýma, radostnýma, velkýma, zadnímaPlur
(25656; 35% of non-emptyNumber
): jednotlivých, různých, dalších, další, jiných, nové, výrobních, různé, nových, základníchPlur,Sing
(1143; 2% of non-emptyNumber
): věnována, dána, provedena, určena, zahájena, povinna, založena, dokončena, stanovena, vybudovánaSing
(47123; 64% of non-emptyNumber
): pracovní, první, možno, další, socialistické, druhé, základní, vlastní, národního, většíEMPTY
(293): Králové, elektro, marxisticko, fit, Karpatsko, teoreticko, online, rakousko, super, československo
Paradigm otevřený | Plur,Sing | Sing | Dual | Plur |
---|---|---|---|---|
Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc | otevřeného | |||
Animacy=Inan|Case=Ins|Degree=Pos|Gender=Masc | otevřeným | otevřenými | ||
Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
Animacy=Inan|Degree=Pos|Gender=Fem,Masc|Variant=Short | otevřeny | |||
Case=Acc|Degree=Pos|Gender=Fem | otevřenou | otevřené | ||
Case=Acc|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
Case=Acc|Degree=Cmp|Gender=Fem | otevřenější | |||
Case=Dat|Degree=Cmp|Gender=Neut | otevřenějšímu | |||
Case=Gen|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Gen|Degree=Pos|Gender=Neut | otevřeného | |||
Case=Ins|Degree=Pos|Gender=Fem | otevřenou | otevřenýma | ||
Case=Ins|Degree=Pos|Gender=Neut | otevřeným | |||
Case=Loc|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Loc|Degree=Pos|Gender=Neut | otevřeném | |||
Case=Nom|Degree=Pos|Gender=Fem | otevřená | |||
Case=Nom|Degree=Pos|Gender=Neut | otevřené | |||
Degree=Pos|Gender=Masc|Variant=Short | otevřen | |||
Degree=Pos|Gender=Fem,Neut|Variant=Short | otevřena | |||
Degree=Pos|Gender=Neut|Variant=Short | otevřeno |
VERB
31221 VERB tokens (81% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (30773; 99%), Polarity=Pos (28513; 91%), Gender=EMPTY (21022; 67%), VerbForm=Fin (21014; 67%), Tense=Pres (20575; 66%), Mood=Ind (20566; 66%), Person=3 (17113; 55%).
VERB
tokens may have the following values of Number
:
Plur
(11637; 37% of non-emptyNumber
): mají, mohou, můžeme, máme, musíme, musí, mohli, měli, měly, tvoříPlur,Sing
(2008; 6% of non-emptyNumber
): měla, mohla, stala, začala, dosáhla, vznikla, dala, zůstala, objevila, přišlaSing
(17576; 56% of non-emptyNumber
): má, může, jde, lze, musí, měl, nelze, znamená, nemůže, patříEMPTY
(7527): mít, zajistit, říci, vidět, dělat, řešit, věnovat, použít, provádět, dosáhnout
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | mělo | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | mějte | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemám | nemáme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | mám | máme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | Nemáš | nemáte | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | máš | máte | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | má | mají |
DET
17097 DET tokens (86% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Number[psor]=EMPTY (15241; 89%), Person=EMPTY (15241; 89%), Animacy=EMPTY (14671; 86%), Poss=EMPTY (13801; 81%).
DET
tokens may have the following values of Number
:
Dual
(5; 0% of non-emptyNumber
): mýma, našima, těmaPlur
(4873; 29% of non-emptyNumber
): které, těchto, tyto, kteří, některých, některé, svých, své, našich, tySing
(12219; 71% of non-emptyNumber
): to, který, která, tím, této, tom, toho, tento, tohoto, tomuEMPTY
(2714): jejich, jeho, několik, mnoho, jehož, jejichž, několika, mnoha, kolik, tolik
Paradigm ten | Sing | Dual | Plur |
---|---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | toho | ty | |
Animacy=Anim|Case=Nom|Gender=Masc | ti | ||
Animacy=Inan|Case=Acc|Gender=Masc | ten | ty | |
Animacy=Inan|Case=Nom|Gender=Masc | ty | ||
Case=Acc|Gender=Fem | tu | ty | |
Case=Acc|Gender=Neut | to | Ta | |
Case=Dat|Gender=Masc,Neut | tomu | ||
Case=Dat|Gender=Fem | té | ||
Case=Dat | těm | ||
Case=Gen|Gender=Masc,Neut | toho | ||
Case=Gen|Gender=Fem | té | ||
Case=Gen | těch | ||
Case=Ins|Gender=Masc,Neut | tím | ||
Case=Ins|Gender=Fem | tou | těma | |
Case=Ins | těmi | ||
Case=Loc|Gender=Masc,Neut | tom | ||
Case=Loc|Gender=Fem | té | ||
Case=Loc|Gender=Fem|Style=Coll | tý | ||
Case=Loc | těch | ||
Case=Nom|Gender=Masc | ten | ||
Case=Nom|Gender=Fem | ta | ty | |
Case=Nom|Gender=Neut | to | ta |
AUX
13688 AUX tokens (85% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Aspect=Imp (13688; 100%), Voice=Act (13313; 97%), Polarity=Pos (12244; 89%), Gender=EMPTY (10867; 79%), VerbForm=Fin (10865; 79%), Mood=Ind (10490; 77%), Person=3 (9379; 69%), Tense=Pres (9307; 68%).
AUX
tokens may have the following values of Number
:
Plur
(3872; 28% of non-emptyNumber
): jsou, jsme, byly, budou, bychom, nejsou, byli, budeme, jste, bystePlur,Sing
(633; 5% of non-emptyNumber
): byla, nebyla, bývalaSing
(9183; 67% of non-emptyNumber
): je, bylo, bude, byl, není, jsem, bych, nebylo, bývá, nebylEMPTY
(2432): by, být, býti, nebýt
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | byli | |
Animacy=Inan|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Fem|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | byly | |
Gender=Fem|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouc | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | byla | |
Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Mood=Cnd|Person=2|VerbForm=Fin | bys | byste | |
Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | buďme | ||
Mood=Imp|Person=2|Polarity=Neg|VerbForm=Fin | Nebuď | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | buď | buďte | |
Mood=Imp|Person=3|Polarity=Pos|VerbForm=Fin | budiž | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | nebudeme | |
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejsem | nejsme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudeš | nebudete | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejste | ||
Mood=Ind|Person=2|Polarity=Pos|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | seš | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budeš | budete | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsi, si | jste | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je, jest | jsou | |
Mood=Ind|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | budou | ||
Mood=Ind|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou | |
Polarity=Pos|Tense=Past|VerbForm=Conv|Voice=Act | byvše | ||
Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouce |
PROPN
7869 PROPN tokens (80% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Abbr=EMPTY (7856; 100%), Gender=Masc (4797; 61%), Case=Nom (3937; 50%).
PROPN
tokens may have the following values of Number
:
Plur
(677; 9% of non-emptyNumber
): Čechách, Klatovech, Pardubice, horách, Bubny, Holešovice, Čech, Holešovic, Karpaty, KlatovySing
(7192; 91% of non-emptyNumber
): Praze, Praha, Škoda, Prahy, Fučík, Erben, Československa, Karel, Horálek, ZeměEMPTY
(1950): KSČ, ROH, SSSR, ÚJČ, SSM, ČSAV, ČSSR, ČSR, TIBA, NDR
Paradigm Karel | Sing | Plur |
---|---|---|
Case=Acc | Karla | |
Case=Dat | Karlu | |
Case=Gen | Karla | |
Case=Ins | Karlem | |
Case=Loc | Karlu | |
Case=Nom | Karel | Karlové |
Number
seems to be lexical feature of PROPN
. 99% lemmas (3077) occur only with one value of Number
.
PRON
5707 PRON tokens (36% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (5706; 100%), Variant=EMPTY (5217; 91%), PronType=Prs (3455; 61%), Gender=EMPTY (3143; 55%).
PRON
tokens may have the following values of Number
:
Plur
(3300; 58% of non-emptyNumber
): všech, nás, je, všechny, nám, nich, nichž, jim, jež, všichniSing
(2407; 42% of non-emptyNumber
): ji, mu, ho, níž, všechno, němž, ní, jej, mi, jáEMPTY
(10279): se, si, co, což, sebe, něco, nic, kdo, sobě, sebou
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Case=Acc|Gender=Masc,Neut|PrepCase=Npr | jej | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Masc|PrepCase=Npr | jeho | |
Case=Acc|Gender=Fem|PrepCase=Npr | ji | |
Case=Acc|Gender=Fem|PrepCase=Pre | ni | |
Case=Acc|Gender=Neut|PrepCase=Npr | je | |
Case=Acc|Gender=Neut|PrepCase=Pre | ně | |
Case=Acc|PrepCase=Npr | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Dat|Gender=Masc,Neut|PrepCase=Npr | jemu | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem|PrepCase=Npr | jí | |
Case=Dat|Gender=Fem|PrepCase=Pre | ní | |
Case=Dat|PrepCase=Npr | jim | |
Case=Dat|PrepCase=Pre | nim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Npr | jej | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něho, něj | |
Case=Gen|Gender=Masc|PrepCase=Npr | jeho | |
Case=Gen|Gender=Fem|PrepCase=Npr | jí | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|PrepCase=Npr | jich | |
Case=Gen|PrepCase=Pre | nich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Npr | jím | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Fem|PrepCase=Npr | jí | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|PrepCase=Npr | jimi | |
Case=Ins|PrepCase=Pre | nimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona | ony |
Case=Nom|Gender=Neut | ono |
NUM
2471 NUM tokens (34% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumForm=Word (2411; 98%), NumType=Card (2411; 98%), Gender=EMPTY (1272; 51%).
NUM
tokens may have the following values of Number
:
Dual
(2; 0% of non-emptyNumber
): dvěma, oběmaPlur
(1281; 52% of non-emptyNumber
): dvou, dvě, tři, dva, obou, dvěma, tří, čtyři, oba, oběSing
(1188; 48% of non-emptyNumber
): jeden, jedné, jednoho, jedním, jednu, jedna, pět, jednom, jedno, tisícEMPTY
(4836): #
Paradigm dva | Dual | Plur |
---|---|---|
Case=Acc|Gender=Masc | dva | |
Case=Acc|Gender=Fem,Neut | dvě | |
Case=Dat | dvěma | |
Case=Gen | dvou | |
Case=Ins|Gender=Fem | dvěma | |
Case=Ins | dvěma | |
Case=Loc | dvou | |
Case=Nom|Gender=Masc | dva | |
Case=Nom|Gender=Fem,Neut | dvě |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (59537; 99%),
NOUN –[nmod]–> NOUN (27177; 61%),
NOUN –[conj]–> NOUN (11640; 81%),
VERB –[nsubj]–> NOUN (10205; 85%),
NOUN –[det]–> DET (8930; 81%),
ADJ –[cop]–> AUX (3965; 87%),
ADJ –[conj]–> ADJ (3718; 93%),
VERB –[conj]–> VERB (3670; 80%),
NOUN –[acl:relcl]–> VERB (2678; 70%),
NOUN –[cop]–> AUX (2514; 76%).