Treebank Statistics: UD_Czech-Poetry: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
3297 tokens (52%) have a non-empty value of Case
.
1852 types (69%) occur at least once with a non-empty value of Case
.
1207 lemmas (63%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (1466; 23% instances), ADJ (548; 9% instances), ADP (545; 9% instances), PRON (378; 6% instances), DET (260; 4% instances), PROPN (83; 1% instances), NUM (17; 0% instances).
NOUN
1466 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (1047; 71%), Animacy=EMPTY (830; 57%).
NOUN
tokens may have the following values of Case
:
Acc
(312; 21% of non-emptyCase
): bohy, den, duši, štěstí, chvíli, hlavu, tvář, pravdu, ruce, rukuDat
(64; 4% of non-emptyCase
): hvězdám, Bohu, břehům, lásce, Kráse, bouřím, bratru, brodu, diademu, druhuGen
(324; 22% of non-emptyCase
): duše, boha, žití, nebes, země, života, květů, lásky, srdce, tělaIns
(170; 12% of non-emptyCase
): vůní, hlavou, očima, propastmi, proudem, ulicemi, řečí, chvílemi, davem, dušíLoc
(179; 12% of non-emptyCase
): kráse, tmách, trůně, chvíli, dně, duši, dálce, lásce, lůžku, místěNom
(394; 27% of non-emptyCase
): oči, svět, bůh, duše, květ, člověk, oheň, ruka, dub, láskaVoc
(23; 2% of non-emptyCase
): bože, duše, Bratře, Hospodine, Matko, Nevěstko, Otče, Patrona, Světice, básníku
Paradigm duše | Nom | Acc | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|
Number=Sing | duše | duši | duše | duše | duši | duší |
Number=Plur | duše | duší | duší, duších |
ADJ
548 ADJ tokens (92% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Polarity=Pos (526; 96%), Degree=Pos (514; 94%), Aspect=EMPTY (509; 93%), Voice=EMPTY (482; 88%), VerbForm=EMPTY (481; 88%), Number=Sing (386; 70%), Animacy=EMPTY (325; 59%).
ADJ
tokens may have the following values of Case
:
Acc
(123; 22% of non-emptyCase
): drobné, mnohé, pestré, pozlátkové, tmavou, Dobrou, Dobrý, Drážděné, Egyptské, KypícíDat
(18; 3% of non-emptyCase
): Věčné, bledé, bludným, cizím, hnědému, jinakým, jiným, mladým, něhyplné, prvnímuGen
(85; 16% of non-emptyCase
): nesmrtelných, rudých, skrytých, velikých, Astartiných, Dobrého, Jordanských, Nazaretského, Perversních, StaréhoIns
(57; 10% of non-emptyCase
): plachou, těžkou, Nesmírnou, Tmavou, bezednou, chladnou, chvějnýma, dráždivou, horkou, hořícímLoc
(62; 11% of non-emptyCase
): kamenném, tvrdém, bílé, modrém, nesmírném, tichém, truchlé, tučném, bezedné, bezemračnémNom
(196; 36% of non-emptyCase
): plný, celý, jiné, černá, Mnohý, Pozdní, bledá, bílý, divoké, jiníVoc
(7; 1% of non-emptyCase
): Svatá, Zsinalá, boží, drahé, milý, mladá, ubohýEMPTY
(49): věrni, Vyloupena, otráven, Očištěna, Rozcuchán, aj, bičován, hodni, marně, možno
Paradigm tichý | Nom | Acc | Gen | Loc | Ins |
---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | tichých | ||||
Animacy=Inan|Gender=Masc|Number=Sing | tichý | tichý | |||
Gender=Fem|Number=Sing | tichou | tiché | tichou | ||
Gender=Fem|Number=Plur | tiché | ||||
Gender=Neut|Number=Sing | tiché | tichém |
ADP
545 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (511; 94%).
ADP
tokens may have the following values of Case
:
Acc
(112; 21% of non-emptyCase
): v, na, pro, přes, o, za, nad, mezi, mimo, poDat
(51; 9% of non-emptyCase
): k, ku, proti, keGen
(99; 18% of non-emptyCase
): z, do, s, bez, u, za, ze, od, dle, kolemIns
(84; 15% of non-emptyCase
): s, nad, pod, před, za, přede, se, mezi, nade, podeLoc
(199; 37% of non-emptyCase
): v, na, ve, o, po, PřiEMPTY
(2): Mezy, na
Paradigm za | Acc | Gen | Ins |
---|---|---|---|
za | za | za |
PRON
378 PRON tokens (99% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Animacy=EMPTY (316; 84%), PronType=Prs (294; 78%), PrepCase=EMPTY (269; 71%), Gender=EMPTY (268; 71%), Reflex=EMPTY (256; 68%), Variant=EMPTY (220; 58%), Person=EMPTY (207; 55%).
PRON
tokens may have the following values of Case
:
Acc
(175; 46% of non-emptyCase
): se, tě, co, je, ji, ho, jej, tebe, jež, měDat
(85; 22% of non-emptyCase
): mi, si, tobě, mu, ti, jí, sobě, Němu, jemu, jimGen
(12; 3% of non-emptyCase
): jich, něho, jichž, nich, nás, níž, vás, čehožIns
(20; 5% of non-emptyCase
): mnou, ním, námi, Jí, nimi, ní, sebou, tebou, vámi, čímsLoc
(15; 4% of non-emptyCase
): nich, nás, níž, němž, Vlasti, nichž, němNom
(71; 19% of non-emptyCase
): jež, já, ty, jenž, co, kdo, nikdo, on, my, NicEMPTY
(3): Ego, naň, te
Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing|Person=3 | On | jej | jemu, mu, Němu | ním | ||
Animacy=Anim|Gender=Masc|Number=Sing|Person=3|Variant=Short | ho | mu | ||||
Animacy=Anim|Gender=Masc|Number=Sing | něj | |||||
Animacy=Inan|Gender=Masc|Number=Sing|Person=3 | něho | něm | ||||
Gender=Masc|Number=Sing|Person=3 | on | jej, něj | Němu | ním | ||
Gender=Masc|Number=Sing|Person=3|Variant=Short | ho | mu | ||||
Gender=Fem|Number=Sing|Person=3 | ji, ni | jí | Jí, ní | |||
Gender=Fem|Number=Plur|Person=3 | je | nich | ||||
Gender=Neut|Number=Sing|Person=3 | ním | |||||
Number=Plur|Person=3 | je | jim, nim | jich | nich | nimi |
DET
260 DET tokens (90% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (210; 81%), Animacy=EMPTY (209; 80%), Person=EMPTY (207; 80%), Reflex=EMPTY (197; 76%), Number=Sing (179; 69%), Poss=EMPTY (148; 57%).
DET
tokens may have the following values of Case
:
Acc
(75; 29% of non-emptyCase
): to, své, svou, svůj, svoje, tvé, všechny, každou, moji, svojiDat
(14; 5% of non-emptyCase
): těm, všem, Ti, své, svému, tomu, tvé, téGen
(36; 14% of non-emptyCase
): svých, tvé, své, té, našich, svého, tvých, těch, všech, TvojeIns
(23; 9% of non-emptyCase
): tolika, vším, mou, naším, tím, jakou, jehožto, každým, mojí, našíLoc
(20; 8% of non-emptyCase
): tom, svém, naší, té, této, jejích, jichž, mé, onom, samémNom
(92; 35% of non-emptyCase
): to, náš, ty, moje, ta, ti, sám, ten, každý, kteráEMPTY
(29): jeho, jejich, jich, jejichž, málo, více
Paradigm ten | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing|PronType=Dem | toho | |||||
Animacy=Anim|Gender=Masc|Number=Plur|PronType=Dem | ti | těm | ||||
Animacy=Inan|Gender=Masc|Number=Sing|PronType=Dem | ten, sěn | |||||
Gender=Masc|Number=Sing|PronType=Dem | ten | |||||
Gender=Fem|Number=Sing|PronType=Dem | ta | tu | té | té | té | |
Gender=Fem|Number=Plur|PronType=Dem | Ty | ty | ||||
Gender=Neut|Number=Sing|PronType=Dem | to | to | tomu | tom | tím | |
Gender=Neut|Number=Plur|PronType=Dem | ty | ta | ||||
Number=Sing|Person=2|PronType=Prs|Variant=Short | Ti | |||||
Number=Plur|PronType=Dem | těm | těch |
PROPN
83 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (73; 88%), Gender=Masc (54; 65%), Animacy=Anim (44; 53%).
PROPN
tokens may have the following values of Case
:
Acc
(15; 18% of non-emptyCase
): Sion, Baudelaira, Diderota, Garizim, Golgatu, Junoše, Kaina, Kanaán, Kirina, OthonaDat
(1; 1% of non-emptyCase
): ArmandoviGen
(11; 13% of non-emptyCase
): Labe, Vltavy, Evy, Hospodina, Israele, Madonny, Nilu, Číny, ŘekůIns
(1; 1% of non-emptyCase
): LůnouLoc
(7; 8% of non-emptyCase
): Bajušáku, Dudákovi, Francii, Herlikanu, Kamčadále, Čechách, ŠvanděNom
(36; 43% of non-emptyCase
): Armand, Svitava, Angelico, Azték, Chodováci, Fenrir, Fra, Galba, German, GulonVoc
(12; 14% of non-emptyCase
): Magdaleno, Maria, Panno, SvěticeEMPTY
(1): Lumíru
Paradigm Armand | Nom | Dat |
---|---|---|
Armand | Armandovi |
Case
seems to be lexical feature of PROPN
. 99% lemmas (67) occur only with one value of Case
.
NUM
17 NUM tokens (94% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (17; 100%), NumType=Card (17; 100%), Number=Sing (12; 71%).
NUM
tokens may have the following values of Case
:
Acc
(3; 18% of non-emptyCase
): Deset, dva, dvacetGen
(4; 24% of non-emptyCase
): dvé, jedné, obou, šestiIns
(2; 12% of non-emptyCase
): jednou, tisícemLoc
(1; 6% of non-emptyCase
): jednomNom
(7; 41% of non-emptyCase
): jeden, Dvé, jednaEMPTY
(1): 80
Paradigm jeden | Nom | Gen | Loc | Ins |
---|---|---|---|---|
Animacy=Anim|Gender=Masc | jeden | |||
Gender=Masc | jeden | |||
Gender=Fem | jedna | jedné | jednou | |
Gender=Neut | jednom |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[case]–> ADP (437; 98%),
NOUN –[amod]–> ADJ (412; 97%),
NOUN –[det]–> DET (161; 83%),
NOUN –[conj]–> NOUN (121; 96%),
PRON –[case]–> ADP (64; 98%),
ADJ –[conj]–> ADJ (38; 97%),
NOUN –[appos]–> NOUN (20; 83%),
DET –[case]–> ADP (14; 100%),
PROPN –[case]–> ADP (12; 92%),
PROPN –[amod]–> ADJ (9; 100%).