Treebank Statistics: UD_Croatian-SET: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
116495 tokens (58%) have a non-empty value of Case
.
30250 types (85%) occur at least once with a non-empty value of Case
.
14913 lemmas (80%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (48386; 24% instances), ADJ (22932; 11% instances), ADP (19089; 10% instances), PROPN (12825; 6% instances), DET (7332; 4% instances), PRON (5302; 3% instances), NUM (629; 0% instances).
NOUN
48386 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (34528; 71%).
NOUN
tokens may have the following values of Case
:
Acc
(10766; 22% of non-emptyCase
): način, ponedjeljak, vrijeme, srijedu, godinu, utorak, petak, mjesto, četvrtak, pomoćDat
(1101; 2% of non-emptyCase
): novinarima, zemlji, djeci, građanima, javnosti, integraciji, premijeru, uniji, zajednici, članstvuGen
(16635; 34% of non-emptyCase
): godine, milijuna, eura, godina, kuna, dana, zemalja, poslova, ljudi, tjednaIns
(2463; 5% of non-emptyCase
): obzirom, ljudima, predsjednikom, zemljama, nazivom, godinama, kolegom, sporazumom, pritiskom, zakonomLoc
(5783; 12% of non-emptyCase
): godini, zemlji, svijetu, području, mjestu, slučaju, odnosu, regiji, izvješću, priopćenjuNom
(11619; 24% of non-emptyCase
): predsjednik, ministar, premijer, dio, vlada, zemlja, ljudi, broj, većina, zemljeVoc
(19; 0% of non-emptyCase
): gospodine, akademiče, braćo, budale, gospodo, gradonačelniče, kurvo, mediji, ministre, papeEMPTY
(191): dr., kg, GB, prof., m, km, g., kn, cm, mil.
Paradigm zemlja | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Number=Sing | zemlja | zemlju | zemlji | zemlje | zemlji | zemljom |
Number=Plur | zemlje | zemlje | zemljama | zemalja | zemljama | zemljama |
ADJ
22932 ADJ tokens (95% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (21824; 95%), Definite=Def (20684; 90%), Number=Sing (15101; 66%).
ADJ
tokens may have the following values of Case
:
Acc
(4237; 18% of non-emptyCase
): sve, prvi, novi, novu, nove, druge, veliku, ratne, drugi, brojneDat
(511; 2% of non-emptyCase
): svim, drugima, europskoj, međunarodnim, svima, drugim, gospodarskom, bivšem, državnim, europskimGen
(6402; 28% of non-emptyCase
): vanjskih, novih, prošle, svih, drugih, prošlog, novog, unutarnjih, europske, hrvatskeIns
(1143; 5% of non-emptyCase
): drugim, ostalim, velikim, novim, političkim, brojnim, međunarodnim, samim, većim, najvećimLoc
(2073; 9% of non-emptyCase
): prvom, svim, drugom, drugim, novom, prvoj, hrvatskom, međunarodnim, svjetskom, tiskovnojNom
(8558; 37% of non-emptyCase
): svi, drugi, novi, glavni, prvi, hrvatski, bivši, moguće, potrebno, mnogiVoc
(8; 0% of non-emptyCase
): Najdraži, Nespretni, Uzoriti, dobri, dragi, mala, prvi, svemogućiEMPTY
(1207): 1., 2004., 2008., 2007., 2009., 2006., 2., 2005., 2010., 21.
Paradigm prvi | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | prvog | ||||||
Animacy=Inan|Gender=Masc|Number=Sing | prvi | ||||||
Gender=Masc|Number=Sing | prvi | prvog, prva, prvoga | prvi | prvom | prvim | ||
Gender=Masc|Number=Plur | prvi | prve | prvih | prvim | prvima | ||
Gender=Fem|Number=Sing | prva | prvu | prvoj | prve | prvoj | prvom | |
Gender=Fem|Number=Plur | prve | prve | prvih | prvim | prvim | ||
Gender=Neut|Number=Sing | prvo | prvo | prvog, prva | prvom | prvim | ||
Gender=Neut|Number=Plur | prvim |
ADP
19089 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
ADP
tokens may have the following values of Case
:
Acc
(5270; 28% of non-emptyCase
): za, u, na, uz, kroz, po, pred, pod, među, nadDat
(89; 0% of non-emptyCase
): unatoč, ka, usprkos, k, nasuprotGen
(4767; 25% of non-emptyCase
): od, iz, do, nakon, zbog, tijekom, protiv, prije, bez, izmeđuIns
(1668; 9% of non-emptyCase
): s, sa, među, pod, za, pred, nad, Preda, umjestoLoc
(7295; 38% of non-emptyCase
): u, na, o, prema, po, pri, ka, naspram, pred
Paradigm u | Acc | Gen | Loc |
---|---|---|---|
u | u | u |
PROPN
12825 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (12511; 98%), Gender=Masc (8339; 65%).
PROPN
tokens may have the following values of Case
:
Acc
(1021; 8% of non-emptyCase
): SETimes, EU, Kosovo, Hrvatsku, BiH, Srbiju, Tursku, NATO, Bugarsku, WindowsDat
(300; 2% of non-emptyCase
): EU, NATO-u, Beogradu, Srbiji, Hrvatskoj, Europi, Kosovu, Vladi, Turskoj, BoguGen
(2975; 23% of non-emptyCase
): EU, Kosova, Srbije, BiH, UN-a, Hrvatske, Europe, Turske, NATO-a, CrneIns
(424; 3% of non-emptyCase
): Srbijom, Crnom, Gorom, Grčkom, Kosovom, EU, Hrvatskom, ICTY-em, Makedonijom, BeogradomLoc
(1591; 12% of non-emptyCase
): Hrvatskoj, Kosovu, Srbiji, Beogradu, EU, Europi, Makedoniji, BiH, NATO-u, ZagrebuNom
(6511; 51% of non-emptyCase
): Hrvatska, Srbija, Kosovo, Makedonija, Bugarska, Turska, Windows, Vlada, EU, BogVoc
(3; 0% of non-emptyCase
): Bože, Isuse, RadovićuEMPTY
(23): R., AMG, B, R, B.o.B., BamS, DI, EBEL, EL, G.
Paradigm EU | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Inan|Number=Sing | EU | |||||
Number=Sing | EU | EU | EU, EU-a | EU, EU-u | EU, EU-om | |
Number=Plur | EU |
DET
7332 DET tokens (95% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (6503; 89%), Person=EMPTY (6503; 89%), Poss=EMPTY (5750; 78%), Number=Sing (5100; 70%).
DET
tokens may have the following values of Case
:
Acc
(1614; 22% of non-emptyCase
): to, koje, svoje, koju, svoj, sve, svoju, koji, taj, tuDat
(192; 3% of non-emptyCase
): tome, kojima, onima, svojim, kojoj, svim, svojoj, kojemu, kojem, tojGen
(1238; 17% of non-emptyCase
): toga, ove, ovog, tih, svojih, te, tog, kojih, svih, svojeIns
(362; 5% of non-emptyCase
): kojim, kojima, tim, time, svojim, kojom, svojom, takvim, ovom, nekimLoc
(779; 11% of non-emptyCase
): kojoj, kojem, tome, tom, kojima, ovom, svojoj, ovoj, svojim, tojNom
(3144; 43% of non-emptyCase
): koji, to, koja, koje, neki, ta, ovo, sve, taj, oniVoc
(3; 0% of non-emptyCase
): moj, moja, mojiEMPTY
(362): nekoliko, više, mnogo, pola, puno, posto, manje, malo, koliko, toliko
Paradigm moj | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | mog | ||||||
Gender=Masc|Number=Sing | moj | mog, moga, mojeg | moj | mojem | |||
Gender=Masc|Number=Plur | moje | moji | mojim | ||||
Gender=Fem|Number=Sing | moja | moju | mojoj | moje | moja | ||
Gender=Fem|Number=Plur | moje | mojih | mojim | ||||
Gender=Neut|Number=Sing | Moje | mog |
PRON
5302 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (4487; 85%), Gender=EMPTY (3785; 71%), Person=EMPTY (3714; 70%), Number=EMPTY (3713; 70%), Reflex=Yes (2899; 55%).
PRON
tokens may have the following values of Case
:
Acc
(3504; 66% of non-emptyCase
): se, ga, ih, što, nas, je, ništa, vas, nešto, meDat
(518; 10% of non-emptyCase
): im, mu, nam, vam, mi, joj, ti, si, nikome, namaGen
(176; 3% of non-emptyCase
): njih, čega, njega, ih, nas, sebe, nje, koga, nečeg, nečegaIns
(106; 2% of non-emptyCase
): čime, njima, sobom, njim, njom, nama, njime, kim, kime, mnomLoc
(91; 2% of non-emptyCase
): njemu, sebi, čemu, njima, nama, njoj, meni, nečemu, nečem, svačemuNom
(906; 17% of non-emptyCase
): što, on, mi, ona, oni, tko, ono, ja, nitko, netkoVoc
(1; 0% of non-emptyCase
): ti
Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Masc | on | ga, njega | mu, njemu | njega | njemu | njim, njime |
Gender=Fem | ona | je, ju, nju | joj, njoj | nje, je | njoj | njom, njome |
Gender=Neut | ono | ga, nj, njega, ono | njime, njim |
NUM
629 NUM tokens (20% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (594; 94%), Number=Sing (433; 69%).
NUM
tokens may have the following values of Case
:
Acc
(118; 19% of non-emptyCase
): jedan, jednu, dvije, jednog, jedno, oba, obje, pedeseti, tridesetDat
(5; 1% of non-emptyCase
): jednoj, Dvjema, objemaGen
(113; 18% of non-emptyCase
): dviju, jednog, jedne, triju, dvaju, obiju, četiriju, obaju, desetaka, jednogaIns
(20; 3% of non-emptyCase
): jednim, jednom, obje, trimaLoc
(51; 8% of non-emptyCase
): jednom, jednoj, dvama, obje, objema, četirima, jednome, oba, trimaNom
(322; 51% of non-emptyCase
): jedan, jedna, dvije, jedno, jedni, obje, oba, dva, Dvoje, dvojaEMPTY
(2519): tri, dva, pet, četiri, 20, 10, šest, deset, 15, 100
Paradigm jedan | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | jednog | |||||
Animacy=Inan|Gender=Masc|Number=Sing | jedan | |||||
Gender=Masc|Number=Sing | jedan | jednog | jednom, jednome | jednim | ||
Gender=Masc|Number=Plur | jedni | |||||
Gender=Fem|Number=Sing | jedna | jednu | jednoj | jedne | jednoj | jednom |
Gender=Neut|Number=Sing | jedno | jedno | jednog, jednoga | jednom |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (17185; 95%),
NOUN –[case]–> ADP (14022; 96%),
NOUN –[conj]–> NOUN (3447; 94%),
NOUN –[det]–> DET (3217; 98%),
PROPN –[flat]–> PROPN (2352; 98%),
PROPN –[case]–> ADP (2341; 98%),
ADJ –[nsubj]–> NOUN (1450; 93%),
NOUN –[flat]–> PROPN (1292; 72%),
PROPN –[conj]–> PROPN (959; 99%),
ADJ –[conj]–> ADJ (813; 99%).