Treebank Statistics: UD_Czech-CAC: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
295929 tokens (60%) have a non-empty value of Case
.
51533 types (83%) occur at least once with a non-empty value of Case
.
22186 lemmas (78%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (135027; 27% instances), ADJ (68871; 14% instances), ADP (48326; 10% instances), DET (17556; 4% instances), PRON (15863; 3% instances), PROPN (7815; 2% instances), NUM (2471; 0% instances).
NOUN
135027 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (95304; 71%), Animacy=EMPTY (79149; 59%).
NOUN
tokens may have the following values of Case
:
Acc
(23982; 18% of non-emptyCase
): práci, dobu, rok, význam, podmínky, úkoly, činnost, pozornost, rozvoj, řaduDat
(5182; 4% of non-emptyCase
): pracovníkům, práci, dispozici, výročí, lidem, řešení, dětem, rozvoji, zlepšení, skutečnostiGen
(47798; 35% of non-emptyCase
): práce, let, roku, hlediska, společnosti, výroby, pracovníků, úkolů, jazyka, lidíIns
(12225; 9% of non-emptyCase
): způsobem, součástí, vodou, cílem, lety, lidmi, prostřednictvím, formou, prací, výsledkemLoc
(17455; 13% of non-emptyCase
): roce, době, oblasti, základě, případě, straně, letech, rámci, práci, smysluNom
(28315; 21% of non-emptyCase
): práce, člověk, lidé, doba, výsledky, pracovník, počet, teorie, organizace, částVoc
(70; 0% of non-emptyCase
): soudruhu, soudruzi, řediteli, náměstku, soudružko, soudružky, doktore, kamaráde, mámo, paneEMPTY
(1156): ÚV, ZV, ZO, JZD, Kčs, ONV, ÚR, MěstNV, BSP, BP
Paradigm člověk | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | člověk | člověka | člověku | člověka | člověku | člověkem | |
Number=Plur | lidé, lidi | lidi | lidem | lidí | Lidi | lidech | lidmi |
ADJ
68871 ADJ tokens (93% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Polarity=Pos (66036; 96%), Degree=Pos (62554; 91%), VerbForm=EMPTY (60939; 88%), Voice=EMPTY (60939; 88%), Number=Sing (44618; 65%), Animacy=EMPTY (41318; 60%).
ADJ
tokens may have the following values of Case
:
Acc
(12223; 18% of non-emptyCase
): další, základní, první, pracovní, nové, jiné, různé, vlastní, celou, většíDat
(2191; 3% of non-emptyCase
): dalšímu, jiným, ostatním, národnímu, jednotlivým, různým, socialistickému, Slovenskému, plánovaným, určitémuGen
(23302; 34% of non-emptyCase
): jednotlivých, národního, socialistické, výrobních, dalších, různých, jiných, nových, základních, pracovníIns
(6436; 9% of non-emptyCase
): jinými, hlavním, ostatními, základním, různými, velkým, elektrickým, dalším, určitým, novýmLoc
(7449; 11% of non-emptyCase
): současné, druhé, různých, jednotlivých, dalších, jiných, celé, pracovní, celém, posledníchNom
(17247; 25% of non-emptyCase
): další, první, možné, nutné, nové, základní, pracovní, větší, různé, ostatníVoc
(23; 0% of non-emptyCase
): vážený, vážení, vážená, vážené, dolarovej, drahej, mladí, podnikovýEMPTY
(5351): možno, nutno, povinen, řečeno, Králové, dosaženo, známo, rád, rádi, věnována
Paradigm mladý | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing | mladý | mladého | mladému | mladého | |||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur | mladí | mladé | mladým | mladých | mladí | mladými | |
Animacy=Anim|Degree=Cmp|Gender=Masc|Number=Sing | mladší | mladšího | |||||
Animacy=Anim|Degree=Cmp|Gender=Masc|Number=Plur | mladší | mladší | mladším | ||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Sing | nejmladšímu | ||||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur | nejmladší | ||||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | mladý | Mladý | mladého | mladém | |||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | mladé | mladých | mladými | ||||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | mladší | ||||||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Plur | mladší | mladší | mladších | ||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Plur | nejmladší | nejmladší | |||||
Degree=Pos|Gender=Fem|Number=Sing | mladá | mladou | mladé | Mladé | mladou | ||
Degree=Pos|Gender=Fem|Number=Plur | mladé | mladé | mladých | ||||
Degree=Pos|Gender=Neut|Number=Sing | mladé | mladé | |||||
Degree=Pos|Gender=Neut|Number=Plur | mladá | mladých | |||||
Degree=Cmp|Gender=Fem|Number=Sing | mladší | Mladší | mladší | mladší | mladší | ||
Degree=Cmp|Gender=Fem|Number=Plur | mladším | mladších | mladšími | ||||
Degree=Cmp|Gender=Neut|Number=Sing | mladšího | ||||||
Degree=Sup|Gender=Fem|Number=Sing | nejmladší | Nejmladší | nejmladší | ||||
Degree=Sup|Gender=Neut|Number=Sing | nejmladšího |
ADP
48326 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (44494; 92%).
ADP
tokens may have the following values of Case
:
Acc
(9665; 20% of non-emptyCase
): na, pro, o, za, v, přes, po, mimo, mezi, veDat
(3483; 7% of non-emptyCase
): k, ke, proti, vůči, naproti, díky, oproti, kvůli, dík, vstřícGen
(10095; 21% of non-emptyCase
): z, do, u, od, podle, ze, bez, za, kolem, kroměIns
(5374; 11% of non-emptyCase
): s, se, mezi, před, pod, nad, za, přede, nadeLoc
(19690; 41% of non-emptyCase
): v, na, ve, o, při, po, in, Pro, a, exNom
(19; 0% of non-emptyCase
): de, kontraEMPTY
(145): vzhledem, de, nehledě, *, a, cross, of, par, aus, del
Paradigm o | Acc | Gen | Loc |
---|---|---|---|
o | o | o |
DET
17556 DET tokens (89% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (15879; 90%), Person=EMPTY (15879; 90%), Animacy=EMPTY (15130; 86%), Poss=EMPTY (14439; 82%), Number=Sing (12040; 69%).
DET
tokens may have the following values of Case
:
Acc
(3633; 21% of non-emptyCase
): to, které, své, tuto, kterou, tyto, svou, který, tento, několikDat
(814; 5% of non-emptyCase
): tomu, tomuto, této, kterým, těmto, svému, těm, každému, některým, jejímuGen
(2999; 17% of non-emptyCase
): toho, tohoto, těchto, této, našeho, naší, některých, svého, našich, svéIns
(1356; 8% of non-emptyCase
): tím, svým, svou, tímto, svými, touto, těmito, jakým, kterým, kterýmiLoc
(1933; 11% of non-emptyCase
): tom, tomto, této, našem, své, těchto, svém, některých, svých, našíNom
(6821; 39% of non-emptyCase
): to, které, která, který, kteří, tato, tyto, tento, každý, našeEMPTY
(2255): jejich, jeho, její, jehož, jejichž, jejíž, quem
Paradigm ten | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | toho | |||||
Animacy=Anim|Gender=Masc|Number=Plur | ti | ty | ||||
Animacy=Inan|Gender=Masc|Number=Sing | ten | |||||
Animacy=Inan|Gender=Masc|Number=Plur | ty | ty | ||||
Gender=Masc,Neut|Number=Sing | tomu | toho | tom | tím | ||
Gender=Masc|Number=Sing | ten | |||||
Gender=Fem|Number=Sing | ta | tu | té | té | té | tou |
Gender=Fem|Number=Sing|Style=Coll | tý | |||||
Gender=Fem|Number=Dual | těma | |||||
Gender=Fem|Number=Plur | ty | ty | ||||
Gender=Neut|Number=Sing | to | to | ||||
Gender=Neut|Number=Plur | ta | Ta | ||||
Number=Plur | těm | těch | těch | těmi |
PRON
15863 PRON tokens (99% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Gender=EMPTY (13052; 82%), PrepCase=EMPTY (13006; 82%), PronType=Prs (12495; 79%), Person=EMPTY (12410; 78%), Number=EMPTY (10157; 64%), Variant=Short (9196; 58%), Reflex=Yes (9042; 57%).
PRON
tokens may have the following values of Case
:
Acc
(9779; 62% of non-emptyCase
): se, je, ji, co, ho, všechny, nás, jej, sebe, něDat
(2186; 14% of non-emptyCase
): si, nám, jim, mu, mi, vám, všem, nim, jí, soběGen
(1173; 7% of non-emptyCase
): všech, nás, nich, nichž, sebe, jich, něho, níž, ní, něhožIns
(572; 4% of non-emptyCase
): nimi, sebou, ním, čím, jimiž, jimi, všemi, čímž, nimiž, jímLoc
(723; 5% of non-emptyCase
): němž, všech, nichž, něm, níž, nich, sobě, ní, čem, všemNom
(1429; 9% of non-emptyCase
): jež, všechny, což, co, všichni, kdo, já, my, všechno, nicVoc
(1; 0% of non-emptyCase
): tyEMPTY
(123): co, they
Paradigm ty | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | ty | tebe | tebe | ty | tebou | ||
Number=Sing|Variant=Short | tě | ti | |||||
Number=Plur | vy | vás | vám | vás | Vás | vámi |
PROPN
7815 PROPN tokens (80% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Abbr=EMPTY (7810; 100%), Number=Sing (7154; 92%), Gender=Masc (4783; 61%).
PROPN
tokens may have the following values of Case
:
Acc
(402; 5% of non-emptyCase
): Slovensko, Fučíka, Prahu, Karpaty, Josefa, Lužnici, Miroslava, Pepíčka, Jeana, MarxeDat
(174; 2% of non-emptyCase
): Erbenovi, Karlu, Pasákovi, Vietnamu, Zemi, Františku, Fučíkovi, Ivo, Janu, KřikavovéGen
(1670; 21% of non-emptyCase
): Prahy, Československa, Země, Evropy, Karla, Gottwalda, Jana, Vltavy, Fermiho, KlementaIns
(360; 5% of non-emptyCase
): Labem, Bečvou, Václavem, Karlem, Prahou, Sázavou, Alpami, Karpatami, Cidlinou, HonzouLoc
(1259; 16% of non-emptyCase
): Praze, Čechách, Brně, Slovensku, Československu, Evropě, Paříži, Hradci, Moskvě, KlatovechNom
(3937; 50% of non-emptyCase
): Praha, Škoda, Fučík, Erben, Karel, Horálek, Knappová, Němec, Těšitelová, BrnoVoc
(13; 0% of non-emptyCase
): Mirku, Dosoudile, Falto, Franto, Hrabale, Jiří, Jiříku, Ladislave, Lubo, LubošiEMPTY
(2004): KSČ, ROH, SSSR, ÚJČ, SSM, ČSAV, ČSSR, ČSR, TIBA, NDR
Paradigm Praha | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Praha | Prahu | Praze | Prahy | Praze | Prahou |
NUM
2471 NUM tokens (34% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (2411; 98%), NumType=Card (2411; 98%), Number=Plur (1281; 52%), Gender=EMPTY (1272; 51%).
NUM
tokens may have the following values of Case
:
Acc
(686; 28% of non-emptyCase
): jeden, tři, dva, dvě, jednu, pět, čtyři, jedno, půl, desetDat
(41; 2% of non-emptyCase
): jednomu, oběma, jedné, dvěma, třetině, šestině, jedenácti, osmi, pár, pětiGen
(566; 23% of non-emptyCase
): dvou, jednoho, obou, tří, tisíc, jedné, čtyř, pěti, půl, šestiIns
(281; 11% of non-emptyCase
): jedním, dvěma, jednou, oběma, třemi, čtyřmi, pěti, dvaceti, sto, třicetiLoc
(271; 11% of non-emptyCase
): jedné, jednom, dvou, obou, třech, čtyřech, deseti, osmi, pěti, sedmiNom
(626; 25% of non-emptyCase
): jeden, dvě, dva, jedna, tři, oba, obě, čtyři, pět, jednoEMPTY
(4836): #
Paradigm jeden | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc | jednoho | |||||
Animacy=Inan|Gender=Masc | jeden | |||||
Gender=Masc,Neut | jednomu | jednoho | jednom | jedním | ||
Gender=Masc | jeden | |||||
Gender=Fem | jedna | jednu | jedné | jedné | jedné | jednou |
Gender=Neut | jedno | jedno |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (59222; 98%),
NOUN –[case]–> ADP (38428; 96%),
NOUN –[conj]–> NOUN (13551; 95%),
NOUN –[det]–> DET (8688; 78%),
ADJ –[conj]–> ADJ (3470; 94%),
PRON –[case]–> ADP (2185; 99%),
PROPN –[case]–> ADP (1846; 83%),
ADJ –[nsubj]–> NOUN (1446; 58%),
DET –[case]–> ADP (1416; 97%),
ADP –[fixed]–> NOUN (1346; 100%).