Treebank Statistics: UD_Karelian-KKPP: Features: Case
This feature is universal.
It occurs with 14 different values: Abe
, Abl
, Acc
, Ade
, Com
, Ela
, Ess
, Gen
, Ill
, Ine
, Ins
, Nom
, Par
, Tra
.
1586 tokens (51%) have a non-empty value of Case
.
1015 types (72%) occur at least once with a non-empty value of Case
.
620 lemmas (66%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (837; 27% instances), PRON (288; 9% instances), ADJ (213; 7% instances), PROPN (181; 6% instances), NUM (42; 1% instances), VERB (20; 1% instances), ADP (3; 0% instances), AUX (2; 0% instances).
NOUN
837 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (587; 70%).
NOUN
tokens may have the following values of Case
:
Abe
(1; 0% of non-emptyCase
): valottaAbl
(5; 1% of non-emptyCase
): saitilta, ulkomailta, ulkopuolelta, Šuolta, šeuvultaAde
(61; 7% of non-emptyCase
): avulla, kielellä, lapšilla, pojalla, tiellä, šuolla, alovehella, muamolla, ruavolla, šijallaCom
(1; 0% of non-emptyCase
): jäšeninehEla
(13; 2% of non-emptyCase
): mieleštä, alkoholista, artistoista, huumehista, järještöistä, kiäštä, luomistöistä, meininkistä, näkömykšistä, tašavalloistaEss
(27; 3% of non-emptyCase
): vuotena, aikana, tarkotukšena, huomenekšena, johtajana, perehenä, piäaihiena, piälaušehena, proplemana, päivänäGen
(191; 23% of non-emptyCase
): muan, kulttuurien, lapšien, karjalan, muajilman, pelin, pojan, -projektin, ihmisen, järještönIll
(68; 8% of non-emptyCase
): aktijoh, kulttuurih, luontoh, pelih, -aktijoh, aikah, hilloh, kieleh, kotih, laitahIne
(70; 8% of non-emptyCase
): yhteistyöššä, kylissä, ativoissa, kilpailušša, lopušša, roolissa, -eepossašta, -leheššä, -teatterissa, -tehnikaššaIns
(1; 0% of non-emptyCase
): ropehellisinNom
(225; 27% of non-emptyCase
): muamo, poika, tunti, ropehet, aktijo, luokka, peli, tuatto, valot, eläjätPar
(167; 20% of non-emptyCase
): ihmisie, hilluo, henkie, kulttuurie, lapšie, lauluja, muata, kaupunkie, kertua, kevätkuutaTra
(7; 1% of non-emptyCase
): kunnivokši, voittajakši, karjalakši, runonlaulajakši, tunniksiEMPTY
(2): klo, ven.
Paradigm ihmini | Nom | Gen | Par | Ine | Ill | Ade |
---|---|---|---|---|---|---|
Number=Sing | ihmini | ihmisen | ihmiseh | |||
Number=Plur | ihmiset | ihmisien | ihmisie | ihmisissä | ihmisillä |
PRON
288 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (186; 65%), Person=EMPTY (161; 56%).
PRON
tokens may have the following values of Case
:
Abl
(1; 0% of non-emptyCase
): meiltäAcc
(2; 1% of non-emptyCase
): ket, miutAde
(17; 6% of non-emptyCase
): meilä, miula, Molommilla, heilä, hänellä, ičellä, ičelläh, kaikilla, kellä, tälläCom
(1; 0% of non-emptyCase
): kaikkineEla
(17; 6% of non-emptyCase
): šiitä, kumpasešta, niistä, Miušta, kumpasistaEss
(2; 1% of non-emptyCase
): tänäGen
(49; 17% of non-emptyCase
): meijän, miun, šen, hänen, kumpasien, šiun, tämän, Näijen, heijän, kenenIll
(18; 6% of non-emptyCase
): mih, šinne, šiih, tähä, molompih, niihi, näih, tähIne
(10; 3% of non-emptyCase
): missä, mistä, täššä, monešša, šiinäIns
(5; 2% of non-emptyCase
): kaikinNom
(126; 44% of non-emptyCase
): hyö, mie, hiän, myö, še, kaikki, šie, ne, kumpaset, mitPar
(40; 14% of non-emptyCase
): mitä, tätä, šitä, iččie, niitä, kumpaista, muuta, Milma, heitä, häntäEMPTY
(1): kennih
Paradigm še | Nom | Gen | Par | Ine | Ill | Ela |
---|---|---|---|---|---|---|
še | šen | šitä | šiinä | šinne, šiih | šiitä |
ADJ
213 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=Sing (133; 62%).
ADJ
tokens may have the following values of Case
:
Ade
(15; 7% of non-emptyCase
): kolmannella, omalla, toisella, Uuvvella, enšimmäisellä, kanšainvälisellä, kovalla, nuorilla, omilla, virallisillaEla
(1; 0% of non-emptyCase
): pahaštaEss
(9; 4% of non-emptyCase
): enšimmäisinä, Eryähänä, pienenä, rehellisenä, viimesenä, viimesinä, šeuruavana, šuurenaGen
(39; 18% of non-emptyCase
): kanšallisien, eeppisien, nuorien, oman, toisen, uuvven, armenijalaisien, azerbaidžanilaisien, eeppisen, enšimmäisenIll
(5; 2% of non-emptyCase
): henkelliseh, kymmenenteh, pikkaraiseh, tarkkah, terväsehIne
(7; 3% of non-emptyCase
): enšimmäiseššä, kanšainvälisistä, kuulusimmissa, oikiešša, toisissa, šamašša, šuurimmistaNom
(69; 32% of non-emptyCase
): 2., toini, 28., Eeppini, mukava, omat, toiset, uuši, 1., 19.Par
(63; 30% of non-emptyCase
): omie, omua, šemmosie, toisie, erilaisie, kypšie, šuurie, Viimesie, alkuperaistä, epävirallistaTra
(5; 2% of non-emptyCase
): parahakši, kannettavakši, šiliekši, šuurimmakšiEMPTY
(3): 21., 23., 25.
Paradigm šuuri | Gen | Par | Ess | Tra | Ine | Ade |
---|---|---|---|---|---|---|
Degree=Cmp|Number=Sing | šuuremman | |||||
Degree=Sup|Number=Sing | šuurimmakši | |||||
Degree=Sup|Number=Plur | šuurimpie | šuurimmista | ||||
Number=Sing | šuurie | šuurena | šuurella | |||
Number=Plur | šuurie |
PROPN
181 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (178; 98%).
PROPN
tokens may have the following values of Case
:
Ade
(7; 4% of non-emptyCase
): Venäjällä, Arbatilla, Kirilällä, PolenovillaEla
(7; 4% of non-emptyCase
): Moskovašta, Kalevalašta, Karjalašta, Murmanskista, Piiteristä, TulaštaGen
(77; 43% of non-emptyCase
): Karjalan, Kalevalan, Venäjän, Kiestinkin, Petroskoin, Art-teltan, Kižin, Pohjolan, WWF:n, AinonIll
(4; 2% of non-emptyCase
): Manalah, KarjalahIne
(14; 8% of non-emptyCase
): Petroskoissa, Petroskoissaki, Aunukšešša, Australijašša, Eremitaašissa, Hristossa, Kalevalašša, Karjalašša, Moskovašša, PariisissaNom
(67; 37% of non-emptyCase
): Kalevala, Anna, Irina, WWF, Art-teltta, Lemminkäini, L’udmila, Mugačeva, Tatjana, AkropolisPar
(5; 3% of non-emptyCase
): Annua, Joukahaista, Kalevala-, Vlasovua, Šeinua
Paradigm Kalevala | Nom | Gen | Ine | Ela |
---|---|---|---|---|
Kalevala | Kalevalan | Kalevalašša | Kalevalašta |
NUM
42 NUM tokens (89% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: Number=Sing (37; 88%), NumType=EMPTY (29; 69%).
NUM
tokens may have the following values of Case
:
Gen
(3; 7% of non-emptyCase
): kahekšan, puolenIne
(2; 5% of non-emptyCase
): Yheššä, šuaššaNom
(33; 79% of non-emptyCase
): kakši, nellä, Yhet, kolme, pari, viisi, 14, 150, 175, 184Par
(4; 10% of non-emptyCase
): miljonie, kuutta, miljardieEMPTY
(5): 2017, 185035, 2, puolitoista
Paradigm yksi | Nom | Ine |
---|---|---|
Number=Sing | yksi | Yheššä |
Number=Plur | Yhet |
Case
seems to be lexical feature of NUM
. 92% lemmas (23) occur only with one value of Case
.
VERB
20 VERB tokens (5% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Mood=EMPTY (20; 100%), Person=EMPTY (20; 100%), Tense=EMPTY (12; 60%), Voice=EMPTY (11; 55%).
VERB
tokens may have the following values of Case
:
Abe
(1; 5% of non-emptyCase
): ajattelomattaAde
(2; 10% of non-emptyCase
): Kieltämällä, šalpuamallaIll
(2; 10% of non-emptyCase
): ruatamah, šyömähIne
(5; 25% of non-emptyCase
): kaččomašša, olomašša, vaihtuas’s’aNom
(10; 50% of non-emptyCase
): järješšetty, kirjutettu, käyty, lašettu, peitetty, pietty, valettu, šanottu, šuunnattuEMPTY
(359): tuli, pitäy, otettih, ošallistu, paissa, kiinnoššuttua, leväheltih, luati, lähettih, löytyä
Case
seems to be lexical feature of VERB
. 100% lemmas (17) occur only with one value of Case
.
ADP
3 ADP tokens (6% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: Number=Sing (3; 100%), Voice=Pass (3; 100%).
ADP
tokens may have the following values of Case
:
Nom
(2; 67% of non-emptyCase
): keritty, vaivuttuPar
(1; 33% of non-emptyCase
): tultuohEMPTY
(45): kera, jälkeh, kešen, vaštah, lisäkši, luo, luona, Ilman, alla, alta
AUX
2 AUX tokens (1% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (2; 100%), Person=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX
tokens may have the following values of Case
:
Gen
(1; 50% of non-emptyCase
): ollunIne
(1; 50% of non-emptyCase
): olleššahEMPTY
(132): on, oli, ei, voit, ois, olet, ollah, oltih, pitäy, en
Paradigm olla | Gen | Ine |
---|---|---|
Number=Sing|Tense=Past|VerbForm=Part | ollun | |
Person[psor]=3|VerbForm=Inf | olleššah |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (136; 91%),
NOUN –[conj]–> NOUN (69; 85%),
NOUN –[det]–> PRON (30; 94%),
PROPN –[flat:name]–> PROPN (14; 67%),
PROPN –[conj]–> PROPN (11; 100%),
ADJ –[conj]–> ADJ (10; 100%),
NOUN –[conj]–> ADJ (6; 75%),
NOUN –[nsubj:cop]–> PRON (6; 86%),
PROPN –[parataxis]–> NOUN (6; 100%),
NOUN –[appos]–> NOUN (5; 100%).