Treebank Statistics: UD_Czech-PUD: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
10488 tokens (56%) have a non-empty value of Case
.
5471 types (72%) occur at least once with a non-empty value of Case
.
3574 lemmas (67%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (4316; 23% instances), ADJ (2010; 11% instances), ADP (1833; 10% instances), PROPN (877; 5% instances), DET (738; 4% instances), PRON (574; 3% instances), NUM (140; 1% instances).
NOUN
4316 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (3083; 71%), Animacy=EMPTY (2408; 56%).
NOUN
tokens may have the following values of Case
:
Acc
(907; 21% of non-emptyCase
): místo, den, rok, část, roky, většinu, dluhopisy, lidi, možnost, měsícDat
(161; 4% of non-emptyCase
): dispozici, podnebí, říši, dívkám, konci, obchodu, obsahu, radě, státům, většiněGen
(1247; 29% of non-emptyCase
): roku, let, století, války, lidí, dolarů, společnosti, doby, eur, liberIns
(366; 8% of non-emptyCase
): l, lety, rokem, autorem, cílem, nedostatkem, nemovitostmi, prezidentem, soudem, vedenímLoc
(623; 14% of non-emptyCase
): roce, letech, době, případě, důsledku, oblasti, světě, městě, období, poloviněNom
(1011; 23% of non-emptyCase
): film, lidé, společnost, vláda, moře, policie, prezident, stát, systém, člověkVoc
(1; 0% of non-emptyCase
): přáteléEMPTY
(167): Curie, DNA, GCA, MPS, Pebe, Really, m, my, t, A
Paradigm stát | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Number=Sing | stát | stát | státu | státem | ||
Number=Plur | státy | státům | států | státech |
ADJ
2010 ADJ tokens (89% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Polarity=Pos (1841; 92%), VerbForm=EMPTY (1800; 90%), Voice=EMPTY (1800; 90%), Degree=Pos (1750; 87%), Number=Sing (1347; 67%), Animacy=EMPTY (1197; 60%).
ADJ
tokens may have the following values of Case
:
Acc
(395; 20% of non-emptyCase
): další, první, vlastní, jiné, novou, nové, hlavní, dlouhé, druhou, novýDat
(87; 4% of non-emptyCase
): Osmanské, Spojeným, nížinné, obecné, větší, Alexandrově, Druhé, Mrtvým, Parmské, StaršíGen
(518; 26% of non-emptyCase
): jiných, nových, prvního, Spojených, amerického, dalších, druhé, nové, první, různýchIns
(167; 8% of non-emptyCase
): americkou, dalším, velkou, dalšími, hlavním, hongkongským, nejvyšším, největším, politickou, prvníLoc
(226; 11% of non-emptyCase
): druhé, posledních, Velké, jižní, první, Nové, Severní, Spojených, bronzové, celémNom
(617; 31% of non-emptyCase
): další, první, velká, severní, poslední, jasné, jižní, možné, nové, PrůmyslováEMPTY
(259): The, schopen, řečeno, National, propuštěn, rád, El, New, Saint, San
Paradigm velký | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur | velcí | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur | největšími | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | velký | velký | velkému | velkého | ||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | velké | velkých | ||||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | větší | větším | ||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing | největší | největším | ||||
Degree=Pos|Gender=Fem|Number=Sing | velká | velkou | velké | Velké | velkou | |
Degree=Pos|Gender=Fem|Number=Plur | velké | |||||
Degree=Pos|Gender=Neut|Number=Sing | velké | velkém | velkým | |||
Degree=Pos|Gender=Neut|Number=Plur | velká | |||||
Degree=Cmp|Gender=Fem|Number=Sing | Větší | větší | větší | větší | ||
Degree=Cmp|Gender=Fem|Number=Plur | větších | |||||
Degree=Sup|Gender=Fem|Number=Sing | největší | největší | největší | |||
Degree=Sup|Gender=Neut|Number=Sing | největším |
ADP
1833 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (1682; 92%).
ADP
tokens may have the following values of Case
:
Acc
(323; 18% of non-emptyCase
): na, pro, za, o, v, po, mimo, přes, ve, meziDat
(115; 6% of non-emptyCase
): k, proti, ke, kvůli, díky, vůči, navzdory, oprotiGen
(411; 22% of non-emptyCase
): z, do, od, ze, během, podle, u, kolem, bez, kroměIns
(215; 12% of non-emptyCase
): s, mezi, před, se, pod, př, nad, zaLoc
(763; 42% of non-emptyCase
): v, na, ve, po, o, při, aNom
(6; 0% of non-emptyCase
): deEMPTY
(9): vzhledem, Von, of, Di, On
Paradigm za | Acc | Gen | Ins |
---|---|---|---|
AdpType=Prep | za | za | za |
AdpType=Voc | za |
PROPN
877 PROPN tokens (80% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Foreign=EMPTY (841; 96%), Number=Sing (817; 93%), Gender=Masc (590; 67%), Animacy=Anim (446; 51%).
PROPN
tokens may have the following values of Case
:
Acc
(69; 8% of non-emptyCase
): Německo, Richarda, Trumpa, Abakumova, Aljašku, Alvareze, Andre, Anglii, Annu, AntarktiduDat
(31; 4% of non-emptyCase
): Evropě, Itálii, Mundu, Roně, Rusku, Andymu, Benoîtovi, Britům, Churchillovi, DisneyoviGen
(177; 20% of non-emptyCase
): Clintonové, Albánie, Ameriky, Afriky, Burgoyna, Disneyho, Donalda, Duffyho, Egypta, FrancieIns
(70; 8% of non-emptyCase
): Albánií, Bogdgegénem, Kristem, Markem, Alvarezem, Anglií, Asií, Averym, Benátkami, BrantemLoc
(93; 11% of non-emptyCase
): Británii, Asii, Africe, Americe, Evropě, Facebooku, Glasgow, Itálii, Norsku, PapuiNom
(437; 50% of non-emptyCase
): Čína, Trump, Bluntová, Británie, Donald, Francie, Mišima, Seagal, Winstone, WrightEMPTY
(214): USA, Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company
Paradigm Trump | Nom | Acc | Gen | Ins |
---|---|---|---|---|
Trump | Trumpa | Trumpa | Trumpem |
DET
738 DET tokens (87% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (691; 94%), Person=EMPTY (691; 94%), Reflex=EMPTY (651; 88%), Animacy=EMPTY (643; 87%), Poss=EMPTY (604; 82%), Number=Sing (512; 69%).
DET
tokens may have the following values of Case
:
Acc
(148; 20% of non-emptyCase
): to, své, svůj, svou, které, několik, který, kterou, mnoho, totoDat
(27; 4% of non-emptyCase
): tomu, svým, kterému, své, těm, těmto, jakékoliv, jejím, kterým, svémuGen
(103; 14% of non-emptyCase
): toho, tohoto, svého, svých, těchto, své, mnoha, té, všech, jejíchIns
(56; 8% of non-emptyCase
): tím, n, svým, jakým, jejím, mnoha, svou, tou, tímto, těmiLoc
(56; 8% of non-emptyCase
): této, tom, svém, té, kterém, tomto, kterých, některých, své, svýchNom
(348; 47% of non-emptyCase
): to, který, která, které, kteří, mnoho, tento, její, každý, totoEMPTY
(106): jeho, jejich, více, její, jejichž, víc, jehož, jejíž, méně
Paradigm ten | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | ty | |||||
Animacy=Inan|Gender=Masc|Number=Sing | ten | |||||
Animacy=Inan|Gender=Masc|Number=Plur | ty | |||||
Gender=Masc,Neut|Number=Sing | tomu | toho | tom | tím | ||
Gender=Masc|Number=Sing | ten | |||||
Gender=Fem|Number=Sing | ta | té | té | tou | ||
Gender=Fem|Number=Plur | ty | ty | ||||
Gender=Neut|Number=Sing | to | to | ||||
Number=Plur | těm | těch | těmi |
PRON
574 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PrepCase=EMPTY (510; 89%), PronType=Prs (480; 84%), Gender=EMPTY (471; 82%), Person=EMPTY (448; 78%), Number=EMPTY (426; 74%), Variant=Short (379; 66%), Reflex=Yes (354; 62%).
PRON
tokens may have the following values of Case
:
Acc
(370; 64% of non-emptyCase
): se, ho, co, ji, mě, je, nás, něco, nic, něDat
(79; 14% of non-emptyCase
): si, mu, jí, jim, nám, mi, čemuž, nimž, němu, něčemuGen
(32; 6% of non-emptyCase
): nich, ní, něj, jich, nichž, mě, něhož, sebe, jehož, jíIns
(21; 4% of non-emptyCase
): ním, nimi, jím, čímž, nikým, ničím, ní, něčím, sebou, čímLoc
(16; 3% of non-emptyCase
): níž, ní, něm, nich, nichž, něčem, sobě, veškeréNom
(56; 10% of non-emptyCase
): což, co, kdo, jenž, někdo, já, nic, on, jež, kdokoliEMPTY
(2): You, me
Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | oni | |||||
Gender=Masc,Neut|Number=Sing | něj, ho, něho | němu | něj | něm | ním, jím | |
Gender=Masc,Neut|Number=Sing|Variant=Short | ho | mu | ||||
Gender=Masc|Number=Sing | on | |||||
Gender=Fem|Number=Sing | ona | ji | jí | ní, jí | ní | ní |
Gender=Neut|Number=Sing | je | |||||
Number=Plur | je, ně | jim | nich, jich | nich | nimi |
NUM
140 NUM tokens (31% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (140; 100%), NumType=Card (140; 100%), Number=Plur (82; 59%), Gender=EMPTY (78; 56%).
NUM
tokens may have the following values of Case
:
Acc
(46; 33% of non-emptyCase
): dva, deset, dvě, čtyři, tři, jedno, jednu, šest, osm, jedenDat
(3; 2% of non-emptyCase
): oběma, dvěmaGen
(24; 17% of non-emptyCase
): jedné, dvou, deseti, jednoho, tří, šesti, obou, osmdesáti, padesáti, sedmiIns
(14; 10% of non-emptyCase
): dvěma, jedním, dvaceti, jednou, osmi, třemiLoc
(21; 15% of non-emptyCase
): dvou, jedné, obou, sedmi, šesti, dvaceti, jedenácti, jednom, pěti, sedmnáctiNom
(32; 23% of non-emptyCase
): jeden, jedna, čtyři, dva, dvě, oba, devět, jedno, pět, sedmnáctEMPTY
(319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492
Paradigm dva | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Masc | dva | dva | ||||
Gender=Fem,Neut | dvě | dvě | ||||
dvěma | dvou | dvou | dvěma |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (1698; 99%),
NOUN –[case]–> ADP (1351; 95%),
NOUN –[det]–> DET (315; 77%),
NOUN –[conj]–> NOUN (247; 97%),
PROPN –[case]–> ADP (180; 83%),
PROPN –[flat]–> PROPN (105; 80%),
PROPN –[amod]–> ADJ (84; 95%),
PRON –[case]–> ADP (73; 100%),
DET –[case]–> ADP (55; 95%),
PROPN –[nmod]–> NOUN (50; 74%).