Treebank Statistics: UD_Czech-PDT: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
187337 tokens (56%) have a non-empty value of Case
.
41609 types (78%) occur at least once with a non-empty value of Case
.
19079 lemmas (71%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (78979; 24% instances), ADJ (38025; 11% instances), ADP (31866; 10% instances), PROPN (13840; 4% instances), DET (11637; 3% instances), PRON (10087; 3% instances), NUM (2903; 1% instances).
NOUN
78979 NOUN tokens (95% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (56889; 72%), Animacy=EMPTY (44546; 56%).
NOUN
tokens may have the following values of Case
:
Acc
(15420; 20% of non-emptyCase
): rok, cenu, peníze, dobu, den, roky, otázku, zájem, možnost, právoDat
(3057; 4% of non-emptyCase
): dispozici, lidem, firmě, občanům, společnosti, bodu, vládě, změnám, veřejnosti, změněGen
(24717; 31% of non-emptyCase
): let, korun, roku, lidí, zákona, procent, světa, strany, práce, vládyIns
(6682; 8% of non-emptyCase
): způsobem, přímkou, lety, koncem, cílem, bodem, rokem, součástí, prostřednictvím, většinouLoc
(9873; 13% of non-emptyCase
): roce, případě, době, letech, straně, světě, trhu, oblasti, základě, rámciNom
(19192; 24% of non-emptyCase
): vláda, předseda, ministr, prezident, firma, lidé, ředitel, společnost, cena, stranaVoc
(38; 0% of non-emptyCase
): pane, čtenáři, doktore, krávo, Soudruhu, paní, starosto, MAJORE, Občane, dětiEMPTY
(4194): p, Kč, r, m, q, s, a, j, b, HZDS
Paradigm vláda | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | vláda | vládu | vládě | vlády | vládo | vládě | vládou |
Number=Plur | vlády | vlády | vládám | vlád | vládami |
ADJ
38025 ADJ tokens (93% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Polarity=Pos (35352; 93%), VerbForm=EMPTY (34203; 90%), Voice=EMPTY (34203; 90%), Degree=Pos (33752; 89%), Number=Sing (26440; 70%), Animacy=EMPTY (22248; 59%).
ADJ
tokens may have the following values of Case
:
Acc
(7257; 19% of non-emptyCase
): další, první, jiné, nové, vlastní, větší, poslední, příští, největší, celouDat
(1404; 4% of non-emptyCase
): dalšímu, zahraničním, české, dalším, jiným, ostatním, vlastní, jinému, pravým, českýmGen
(11092; 29% of non-emptyCase
): české, českého, dalších, nového, českých, první, zahraničních, evropské, národního, druhéIns
(3141; 8% of non-emptyCase
): hlavním, dalším, českou, jinými, největším, dalšími, velkou, jediným, druhou, prvníLoc
(4249; 11% of non-emptyCase
): druhé, prvním, první, současné, české, posledních, poslední, druhém, dalším, českémNom
(10871; 29% of non-emptyCase
): další, první, možné, česká, státní, nový, český, nová, nové, národníVoc
(11; 0% of non-emptyCase
): Vážení, rudá, Laskavý, Vážená, drahá, mikrovlnný, neznámá, vzdálenáEMPTY
(2742): tzv, a, řečeno, rád, možno, čs, česko, schopen, známo, připravena
Paradigm známý | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg | neznámý | neznámého | |||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos | známý | známého | známým | ||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Neg | neznámí | neznámé | |||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos | známí | známým | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Sing|Polarity=Pos | nejznámější | nejznámějším | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur|Polarity=Pos | nejznámější | nejznámějších | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg | neznámý | neznámého | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos | známý | známý | známého | známým | |||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Neg | neznámých | neznámými | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos | známé | známé | známým | známých | |||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing|Polarity=Pos | Nejznámějším | ||||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Plur|Polarity=Pos | nejznámější | ||||||
Degree=Pos|Gender=Fem|Number=Sing|Polarity=Neg | neznámá | neznámá | |||||
Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos | známá | známou | známé | známé | známou | ||
Degree=Pos|Gender=Fem|Number=Plur|Polarity=Neg | neznámých | ||||||
Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos | známé | známých | |||||
Degree=Pos|Gender=Neut|Number=Sing|Polarity=Neg | neznámé | neznámým | |||||
Degree=Pos|Gender=Neut|Number=Sing|Polarity=Pos | známé | známé | známého | známým | |||
Degree=Pos|Gender=Neut|Number=Plur|Polarity=Neg | neznámá | ||||||
Degree=Pos|Gender=Neut|Number=Plur|Polarity=Pos | známých |
ADP
31866 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (29399; 92%).
ADP
tokens may have the following values of Case
:
Acc
(6763; 21% of non-emptyCase
): na, pro, za, o, v, přes, ve, po, mezi, mimoDat
(2019; 6% of non-emptyCase
): k, proti, ke, díky, vůči, kvůli, oproti, naproti, ku, navzdoryGen
(7004; 22% of non-emptyCase
): z, do, od, podle, u, ze, bez, během, za, kolemIns
(3655; 11% of non-emptyCase
): s, se, před, mezi, nad, pod, za, n, přede, přLoc
(12413; 39% of non-emptyCase
): v, na, o, ve, po, přiNom
(12; 0% of non-emptyCase
): kontra, versus, v, adEMPTY
(77): vzhledem, nehledě, narozdíl
Paradigm za | Acc | Gen | Ins |
---|---|---|---|
za | za | za |
PROPN
13840 PROPN tokens (88% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (13115; 95%), Gender=Masc (8990; 65%), NameType=Giv (7541; 54%), Animacy=Anim (7232; 52%).
PROPN
tokens may have the following values of Case
:
Acc
(646; 5% of non-emptyCase
): Slovensko, Německo, Evropu, Prahu, Jiřího, Rusko, Albrightovou, Letnou, Moravu, IrskoDat
(311; 2% of non-emptyCase
): Německu, Polsku, Slovensku, Brnu, Evropě, Pavlu, Glassmannovi, Hitlerovi, Jelcinovi, PetruGen
(2830; 20% of non-emptyCase
): Evropy, Prahy, Jana, Německa, Slovenska, Ruska, Sparty, Československa, Václava, ČechIns
(708; 5% of non-emptyCase
): Labem, Německem, Slovenskem, Polskem, Ruskem, Izraelem, Rakouskem, Klausem, Němci, SrbyLoc
(1636; 12% of non-emptyCase
): Praze, Německu, Evropě, Brně, Slovensku, Francii, Ostravě, Bratislavě, Čechách, AmericeNom
(7700; 56% of non-emptyCase
): Praha, Jiří, Jan, Václav, Vladimír, Klaus, Petr, Pavel, Josef, OstravaVoc
(9; 0% of non-emptyCase
): Baryku, Johne, Kriste, Nitsche, Pavle, Reichu, Steve, Werichu, ČaskoEMPTY
(1901): ČR, ODS, LN, USA, OSN, ČSFR, NATO, SR, ČSSD, EU
Paradigm Praha | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Praha, PRAHA | Prahu | Praze | Prahy | Praze | Prahou |
DET
11637 DET tokens (91% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (10665; 92%), Person=EMPTY (10665; 92%), Animacy=EMPTY (10068; 87%), Poss=EMPTY (9549; 82%), Number=Sing (8213; 71%).
DET
tokens may have the following values of Case
:
Acc
(2776; 24% of non-emptyCase
): to, které, své, svou, kterou, svůj, který, tuto, všechny, několikDat
(522; 4% of non-emptyCase
): tomu, tomuto, všem, svým, své, svému, této, těm, kterým, jejímuGen
(1698; 15% of non-emptyCase
): toho, tohoto, všech, těchto, svého, této, svých, své, našeho, některýchIns
(830; 7% of non-emptyCase
): tím, svým, svou, tímto, svými, jakým, těmito, kterým, několika, toutoLoc
(1187; 10% of non-emptyCase
): tom, tomto, této, svém, své, kterém, těchto, všech, svých, kteréNom
(4622; 40% of non-emptyCase
): to, který, které, která, kteří, tato, tento, ten, sám, jejíVoc
(2; 0% of non-emptyCase
): Má, můjEMPTY
(1161): jeho, jejich, její, jejichž, jehož, jejíž, pár, t, móóc
Paradigm můj | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | moji | ||||||
Animacy=Inan|Gender=Masc|Number=Sing | můj | ||||||
Animacy=Inan|Gender=Masc|Number=Plur | moje | ||||||
Gender=Masc,Neut|Number=Sing | mému | mého | mém | mým | |||
Gender=Masc|Number=Sing | můj | můj | |||||
Gender=Masc|Number=Plur | mé | ||||||
Gender=Fem,Neut|Number=Sing | moje | ||||||
Gender=Fem,Neut|Number=Plur | moje | ||||||
Gender=Fem|Number=Sing | má | mou, moji | mé | mé, mojí | Má | mou, mojí | |
Gender=Fem|Number=Plur | mé | ||||||
Gender=Neut|Number=Sing | Mé | moje, mé | |||||
Number=Plur | mým | mých | mých | mými |
PRON
10087 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Gender=EMPTY (8690; 86%), PrepCase=EMPTY (8389; 83%), PronType=Prs (8362; 83%), Person=EMPTY (7472; 74%), Number=EMPTY (6958; 69%), Variant=Short (6105; 61%), Reflex=Yes (5747; 57%).
PRON
tokens may have the following values of Case
:
Acc
(6151; 61% of non-emptyCase
): se, je, co, ji, ho, nás, nic, jej, něco, měDat
(1710; 17% of non-emptyCase
): si, nám, mu, mi, jim, jí, vám, jimž, sobě, jemužGen
(636; 6% of non-emptyCase
): nás, nich, jich, nichž, něj, jehož, ní, něho, níž, něhožIns
(300; 3% of non-emptyCase
): nimi, ním, sebou, čím, jím, námi, ní, jimiž, níž, mnouLoc
(352; 3% of non-emptyCase
): něm, němž, níž, nichž, ní, nich, sobě, čem, mně, násNom
(934; 9% of non-emptyCase
): co, kdo, což, já, my, nikdo, někdo, on, jež, nicVoc
(4; 0% of non-emptyCase
): tyEMPTY
(9): co
Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | oni | |||||
Gender=Masc,Neut|Number=Sing | jej, něj, něho | němu, jemu | něj, něho, jej | něm | ním, jím | |
Gender=Masc,Neut|Number=Sing|Variant=Short | ho | mu | ho | |||
Gender=Masc|Number=Sing | on | jeho | ||||
Gender=Fem|Number=Sing | ona | ji, ni | jí, ní | ní, jí | ní | ní, jí |
Gender=Fem|Number=Plur | ony | |||||
Gender=Neut|Number=Sing | ono | je, ně | ||||
Number=Plur | je, ně | jim, nim | nich, jich | nich | nimi, jimi |
NUM
2903 NUM tokens (31% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (2895; 100%), NumForm=Word (2367; 82%), Number=Plur (1682; 58%).
NUM
tokens may have the following values of Case
:
Acc
(894; 31% of non-emptyCase
): tři, dva, dvě, čtyři, pět, jednu, šest, jeden, deset, dvacetDat
(37; 1% of non-emptyCase
): dvěma, oběma, jedné, třem, čtyřem, deseti, jednomu, milionům, miliónu, nejednomuGen
(754; 26% of non-emptyCase
): miliónů, milionů, dvou, jednoho, tří, miliard, obou, jedné, miliardy, šestiIns
(256; 9% of non-emptyCase
): jedním, dvěma, jednou, třemi, pěti, čtyřmi, oběma, milióny, deseti, šestiLoc
(251; 9% of non-emptyCase
): dvou, jedné, jednom, obou, třech, čtyřech, pěti, šesti, dvaceti, osmiNom
(710; 24% of non-emptyCase
): jeden, dva, oba, jedna, dvě, tři, pět, čtyři, jedno, oběVoc
(1; 0% of non-emptyCase
): miliónyEMPTY
(6355): 1, 2, 3, tisíc, 4, 10, 5, 1992, 6, 1993
Paradigm milión | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | milión | milión | miliónu | miliónu | |||
Number=Plur | milióny | milióny | miliónů | milióny | miliónech | milióny |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (32364; 98%),
NOUN –[case]–> ADP (23568; 95%),
NOUN –[det]–> DET (5322; 81%),
NOUN –[conj]–> NOUN (4400; 93%),
PROPN –[case]–> ADP (2788; 87%),
NOUN –[flat]–> PROPN (2227; 99%),
PROPN –[flat]–> PROPN (1598; 93%),
PRON –[case]–> ADP (1339; 99%),
ADJ –[conj]–> ADJ (1205; 90%),
PROPN –[conj]–> PROPN (1053; 92%).