Statistics of Case in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Czech-Poetry: Features: `Case`

This feature is universal. It occurs with 7 different values: Acc, Dat, Gen, Ins, Loc, Nom, Voc.

3297 tokens (52%) have a non-empty value of Case. 1852 types (69%) occur at least once with a non-empty value of Case. 1207 lemmas (63%) occur at least once with a non-empty value of Case. The feature is used with 7 part-of-speech tags: NOUN (1466; 23% instances), ADJ (548; 9% instances), ADP (545; 9% instances), PRON (378; 6% instances), DET (260; 4% instances), PROPN (83; 1% instances), NUM (17; 0% instances).

`NOUN`

1466 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.

The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (1047; 71%), Animacy=EMPTY (830; 57%).

NOUN tokens may have the following values of Case:

Acc (312; 21% of non-empty Case): bohy, den, duši, štěstí, chvíli, hlavu, tvář, pravdu, ruce, ruku
Dat (64; 4% of non-empty Case): hvězdám, Bohu, břehům, lásce, Kráse, bouřím, bratru, brodu, diademu, druhu
Gen (324; 22% of non-empty Case): duše, boha, žití, nebes, země, života, květů, lásky, srdce, těla
Ins (170; 12% of non-empty Case): vůní, hlavou, očima, propastmi, proudem, ulicemi, řečí, chvílemi, davem, duší
Loc (179; 12% of non-empty Case): kráse, tmách, trůně, chvíli, dně, duši, dálce, lásce, lůžku, místě
Nom (394; 27% of non-empty Case): oči, svět, bůh, duše, květ, člověk, oheň, ruka, dub, láska
Voc (23; 2% of non-empty Case): bože, duše, Bratře, Hospodine, Matko, Nevěstko, Otče, Patrona, Světice, básníku

Paradigm duše	`Nom`	`Acc`	`Gen`	`Voc`	`Loc`	`Ins`
`Number=Sing`	duše	duši	duše	duše	duši	duší
`Number=Plur`	duše		duší		duší, duších

`ADJ`

548 ADJ tokens (92% of all ADJ tokens) have a non-empty value of Case.

The most frequent other feature values with which ADJ and Case co-occurred: Polarity=Pos (526; 96%), Degree=Pos (514; 94%), Aspect=EMPTY (509; 93%), Voice=EMPTY (482; 88%), VerbForm=EMPTY (481; 88%), Number=Sing (386; 70%), Animacy=EMPTY (325; 59%).

ADJ tokens may have the following values of Case:

Acc (123; 22% of non-empty Case): drobné, mnohé, pestré, pozlátkové, tmavou, Dobrou, Dobrý, Drážděné, Egyptské, Kypící
Dat (18; 3% of non-empty Case): Věčné, bledé, bludným, cizím, hnědému, jinakým, jiným, mladým, něhyplné, prvnímu
Gen (85; 16% of non-empty Case): nesmrtelných, rudých, skrytých, velikých, Astartiných, Dobrého, Jordanských, Nazaretského, Perversních, Starého
Ins (57; 10% of non-empty Case): plachou, těžkou, Nesmírnou, Tmavou, bezednou, chladnou, chvějnýma, dráždivou, horkou, hořícím
Loc (62; 11% of non-empty Case): kamenném, tvrdém, bílé, modrém, nesmírném, tichém, truchlé, tučném, bezedné, bezemračném
Nom (196; 36% of non-empty Case): plný, celý, jiné, černá, Mnohý, Pozdní, bledá, bílý, divoké, jiní
Voc (7; 1% of non-empty Case): Svatá, Zsinalá, boží, drahé, milý, mladá, ubohý
EMPTY (49): věrni, Vyloupena, otráven, Očištěna, Rozcuchán, aj, bičován, hodni, marně, možno

Paradigm tichý	`Nom`	`Acc`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc\|Number=Plur`			tichých
`Animacy=Inan\|Gender=Masc\|Number=Sing`	tichý	tichý
`Gender=Fem\|Number=Sing`		tichou		tiché	tichou
`Gender=Fem\|Number=Plur`	tiché
`Gender=Neut\|Number=Sing`	tiché			tichém

`ADP`

545 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.

The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (511; 94%).

ADP tokens may have the following values of Case:

Acc (112; 21% of non-empty Case): v, na, pro, přes, o, za, nad, mezi, mimo, po
Dat (51; 9% of non-empty Case): k, ku, proti, ke
Gen (99; 18% of non-empty Case): z, do, s, bez, u, za, ze, od, dle, kolem
Ins (84; 15% of non-empty Case): s, nad, pod, před, za, přede, se, mezi, nade, pode
Loc (199; 37% of non-empty Case): v, na, ve, o, po, Při
EMPTY (2): Mezy, na

Paradigm za	`Acc`	`Gen`	`Ins`
	za	za	za

`PRON`

378 PRON tokens (99% of all PRON tokens) have a non-empty value of Case.

The most frequent other feature values with which PRON and Case co-occurred: Animacy=EMPTY (316; 84%), PronType=Prs (294; 78%), PrepCase=EMPTY (269; 71%), Gender=EMPTY (268; 71%), Reflex=EMPTY (256; 68%), Variant=EMPTY (220; 58%), Person=EMPTY (207; 55%).

PRON tokens may have the following values of Case:

Acc (175; 46% of non-empty Case): se, tě, co, je, ji, ho, jej, tebe, jež, mě
Dat (85; 22% of non-empty Case): mi, si, tobě, mu, ti, jí, sobě, Němu, jemu, jim
Gen (12; 3% of non-empty Case): jich, něho, jichž, nich, nás, níž, vás, čehož
Ins (20; 5% of non-empty Case): mnou, ním, námi, Jí, nimi, ní, sebou, tebou, vámi, číms
Loc (15; 4% of non-empty Case): nich, nás, níž, němž, Vlasti, nichž, něm
Nom (71; 19% of non-empty Case): jež, já, ty, jenž, co, kdo, nikdo, on, my, Nic
EMPTY (3): Ego, naň, te

Paradigm on	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc\|Number=Sing\|Person=3`	On	jej	jemu, mu, Němu			ním
`Animacy=Anim\|Gender=Masc\|Number=Sing\|Person=3\|Variant=Short`		ho	mu
`Animacy=Anim\|Gender=Masc\|Number=Sing`		něj
`Animacy=Inan\|Gender=Masc\|Number=Sing\|Person=3`				něho	něm
`Gender=Masc\|Number=Sing\|Person=3`	on	jej, něj	Němu			ním
`Gender=Masc\|Number=Sing\|Person=3\|Variant=Short`		ho	mu
`Gender=Fem\|Number=Sing\|Person=3`		ji, ni	jí			Jí, ní
`Gender=Fem\|Number=Plur\|Person=3`		je		nich
`Gender=Neut\|Number=Sing\|Person=3`						ním
`Number=Plur\|Person=3`		je	jim, nim	jich	nich	nimi

`DET`

260 DET tokens (90% of all DET tokens) have a non-empty value of Case.

The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (210; 81%), Animacy=EMPTY (209; 80%), Person=EMPTY (207; 80%), Reflex=EMPTY (197; 76%), Number=Sing (179; 69%), Poss=EMPTY (148; 57%).

DET tokens may have the following values of Case:

Acc (75; 29% of non-empty Case): to, své, svou, svůj, svoje, tvé, všechny, každou, moji, svoji
Dat (14; 5% of non-empty Case): těm, všem, Ti, své, svému, tomu, tvé, té
Gen (36; 14% of non-empty Case): svých, tvé, své, té, našich, svého, tvých, těch, všech, Tvoje
Ins (23; 9% of non-empty Case): tolika, vším, mou, naším, tím, jakou, jehožto, každým, mojí, naší
Loc (20; 8% of non-empty Case): tom, svém, naší, té, této, jejích, jichž, mé, onom, samém
Nom (92; 35% of non-empty Case): to, náš, ty, moje, ta, ti, sám, ten, každý, která
EMPTY (29): jeho, jejich, jich, jejichž, málo, více

Paradigm ten	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc\|Number=Sing\|PronType=Dem`				toho
`Animacy=Anim\|Gender=Masc\|Number=Plur\|PronType=Dem`	ti		těm
`Animacy=Inan\|Gender=Masc\|Number=Sing\|PronType=Dem`		ten, sěn
`Gender=Masc\|Number=Sing\|PronType=Dem`	ten
`Gender=Fem\|Number=Sing\|PronType=Dem`	ta	tu	té	té	té
`Gender=Fem\|Number=Plur\|PronType=Dem`	Ty	ty
`Gender=Neut\|Number=Sing\|PronType=Dem`	to	to	tomu		tom	tím
`Gender=Neut\|Number=Plur\|PronType=Dem`	ty	ta
`Number=Sing\|Person=2\|PronType=Prs\|Variant=Short`			Ti
`Number=Plur\|PronType=Dem`			těm	těch

`PROPN`

83 PROPN tokens (99% of all PROPN tokens) have a non-empty value of Case.

The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (73; 88%), Gender=Masc (54; 65%), Animacy=Anim (44; 53%).

PROPN tokens may have the following values of Case:

Acc (15; 18% of non-empty Case): Sion, Baudelaira, Diderota, Garizim, Golgatu, Junoše, Kaina, Kanaán, Kirina, Othona
Dat (1; 1% of non-empty Case): Armandovi
Gen (11; 13% of non-empty Case): Labe, Vltavy, Evy, Hospodina, Israele, Madonny, Nilu, Číny, Řeků
Ins (1; 1% of non-empty Case): Lůnou
Loc (7; 8% of non-empty Case): Bajušáku, Dudákovi, Francii, Herlikanu, Kamčadále, Čechách, Švandě
Nom (36; 43% of non-empty Case): Armand, Svitava, Angelico, Azték, Chodováci, Fenrir, Fra, Galba, German, Gulon
Voc (12; 14% of non-empty Case): Magdaleno, Maria, Panno, Světice
EMPTY (1): Lumíru

Paradigm Armand	`Nom`	`Dat`
	Armand	Armandovi

Case seems to be lexical feature of PROPN. 99% lemmas (67) occur only with one value of Case.

`NUM`

17 NUM tokens (94% of all NUM tokens) have a non-empty value of Case.

The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (17; 100%), NumType=Card (17; 100%), Number=Sing (12; 71%).

NUM tokens may have the following values of Case:

Acc (3; 18% of non-empty Case): Deset, dva, dvacet
Gen (4; 24% of non-empty Case): dvé, jedné, obou, šesti
Ins (2; 12% of non-empty Case): jednou, tisícem
Loc (1; 6% of non-empty Case): jednom
Nom (7; 41% of non-empty Case): jeden, Dvé, jedna
EMPTY (1): 80

Paradigm jeden	`Nom`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc`	jeden
`Gender=Masc`	jeden
`Gender=Fem`	jedna	jedné		jednou
`Gender=Neut`			jednom

Relations with Agreement in `Case`

The 10 most frequent relations where parent and child node agree in Case: NOUN –[case]–> ADP (437; 98%), NOUN –[amod]–> ADJ (412; 97%), NOUN –[det]–> DET (161; 83%), NOUN –[conj]–> NOUN (121; 96%), PRON –[case]–> ADP (64; 98%), ADJ –[conj]–> ADJ (38; 97%), NOUN –[appos]–> NOUN (20; 83%), DET –[case]–> ADP (14; 100%), PROPN –[case]–> ADP (12; 92%), PROPN –[amod]–> ADJ (9; 100%).

Treebank Statistics: UD_Czech-Poetry: Features: Case

NOUN

ADJ

ADP

PRON

DET

PROPN

NUM

Relations with Agreement in Case