Treebank Statistics: UD_Moksha-JR: Features: Case
This feature is universal but the values Cmp
, Prl
are language-specific.
It occurs with 16 different values: Abe
, Abl
, Cau
, Cmp
, Com
, Dat
, Ela
, Gen
, Ill
, Ine
, Lat
, Loc
, Nom
, Prl
, Tem
, Tra
.
1913 tokens (44%) have a non-empty value of Case
.
1403 types (66%) occur at least once with a non-empty value of Case
.
878 lemmas (65%) occur at least once with a non-empty value of Case
.
The feature is used with 10 part-of-speech tags: NOUN (1099; 25% instances), ADJ (216; 5% instances), PRON (212; 5% instances), VERB (109; 3% instances), PROPN (82; 2% instances), ADP (69; 2% instances), ADV (65; 1% instances), NUM (33; 1% instances), DET (26; 1% instances), AUX (2; 0% instances).
NOUN
1099 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number[psor]=EMPTY (922; 84%), Person[psor]=EMPTY (922; 84%), Definite=Ind (606; 55%).
NOUN
tokens may have the following values of Case
:
Abe
(3; 0% of non-emptyCase
): лемфтома, перилафтома, эрьгяфтомаAbl
(24; 2% of non-emptyCase
): ломаньда, ширде, Аннада, Пиледот, алда, алядот, вайгяльда, врьгазда, занятияда, имождаCau
(1; 0% of non-emptyCase
): лезксонксаCmp
(2; 0% of non-emptyCase
): пялешка, сурбряшкаCom
(5; 0% of non-emptyCase
): шинек-венек, куднек, саднек-мезнек, ульцянекDat
(45; 4% of non-emptyCase
): Алязтиге, Дарюняти, Кенкшти, Кепотьксонди, Кинди, Луканди, Маринкати, Цёранянди, Ялгати, авардематнендиEla
(37; 3% of non-emptyCase
): велеста, комнатаста, кудста, онцтон, пингста, пингстонза, ёткста, Вирьста, Москуста, базарстаGen
(286; 26% of non-emptyCase
): пингть, паксянь, сёксень, цёранц, шить, валхнень, велеть, менельть, мирденц, очконятьIll
(36; 3% of non-emptyCase
): лангс, каршес, вастс, кучкас, лангозонза, вастозонза, вельхксс, воляс, кудрядс, лафтубрязонзаIne
(99; 9% of non-emptyCase
): вирьса, кудса, лангса, ярмакса, больницяса, вайгяльса, войнаса, кизоса, мяльса, тюссаLat
(42; 4% of non-emptyCase
): инголи, ульцяв, куду, паксяв, шири, школав, Колхозу, Крыму, Мазы, МаманявNom
(463; 42% of non-emptyCase
): ломаттне, шись, ава, Тишка, ланга, ломань, пря, стирнятне, шамац, визьксPrl
(28; 3% of non-emptyCase
): вальмава, морява, пандонява, алга, вастоваст, ведьгя, велькска, вельхкска, вирьгя, вярьгяTem
(6; 1% of non-emptyCase
): шиня, ПиземняTra
(22; 2% of non-emptyCase
): сторожкс, геройкс, депутатокс, июленнекс, кизоннекс, комендантокс, крайкс, лётчикокс, лётчикокска, мокшексEMPTY
(14): И., Ильич, Н., атяй, бабай, варсиньбря, ветродуйхне, видьмода-эрьгада, кожфкаса, лямбошинкса
Paradigm куд | Nom | Gen | Com | Ine | Ela | Lat | Prl |
---|---|---|---|---|---|---|---|
Definite=Def|Number=Sing | кудть | ||||||
Definite=Def|Number=Plur | куттне | куттнень | |||||
Definite=Ind|Number=Plur,Sing | куднек | кудса | кудста | куду | кудга | ||
Degree=Dim|Number=Plur,Sing|Number[psor]=Sing|Person[psor]=3 | куднястонза | ||||||
Number=Sing|Number[psor]=Sing|Person[psor]=1 | кудозень | ||||||
Number=Plur,Sing|Number[psor]=Plur|Person[psor]=3 | кудсна |
ADJ
216 ADJ tokens (96% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Definite=Ind (199; 92%), Number=Sing (199; 92%).
ADJ
tokens may have the following values of Case
:
Abl
(1; 0% of non-emptyCase
): пародонгаDat
(1; 0% of non-emptyCase
): анокондиEla
(2; 1% of non-emptyCase
): Ёмластокиге, маластоньGen
(9; 4% of non-emptyCase
): Очижинь, омбоцеть, тячиень, Мокшень, Передовойть, главнайть, моронц, оцюняснонNom
(201; 93% of non-emptyCase
): оцю, од, тяфтама, мазы, пара, сире, цебярь, акша, кодама, козяTra
(2; 1% of non-emptyCase
): Немойкс, роднойксEMPTY
(9): васенце, ляпе, капакшу, каши, кодямот, озадонь
Paradigm пара | Nom | Abl |
---|---|---|
Clitic=AddNgA|Number=Plur,Sing | пародонга | |
Number=Sing | пара | |
Number=Sing|Number[subj]=Sing|Person[subj]=3|Tense=Past | пароль |
Case
seems to be lexical feature of ADJ
. 94% lemmas (98) occur only with one value of Case
.
PRON
212 PRON tokens (98% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Variant=EMPTY (188; 89%), Number=Sing (160; 75%), Definite=EMPTY (156; 74%), PronType=Prs (126; 59%).
PRON
tokens may have the following values of Case
:
Abl
(4; 2% of non-emptyCase
): Мезьда, Тяда, мондедон, сембодаCau
(2; 1% of non-emptyCase
): мезенксаCmp
(1; 0% of non-emptyCase
): КонашкаDat
(27; 13% of non-emptyCase
): тейнза, тейть, Тейне, кинди, теень, тейст, Кой-кинди, Мондейне, Сондеенза, СондейнзаGen
(52; 25% of non-emptyCase
): сонь, монь, сембонь, тонь, синь, тянь, минь, Мезень, конань, ЛиятненьIll
(1; 0% of non-emptyCase
): эсезостIne
(1; 0% of non-emptyCase
): мезьсаNom
(124; 58% of non-emptyCase
): сон, мон, тя, ся, тон, синь, мезевок, минь, кона, мезеEMPTY
(5): ськамот, Ня, кафонест, кафцьке
Paradigm мезе | Nom | Gen | Ine | Abl | Cau |
---|---|---|---|---|---|
Clitic=Add|Definite=Ind|Number=Sing | мезевок | ||||
Number=Sing | мезе | ||||
Number=Sing|PronType=Int | мезе | ||||
Number=Plur,Sing | Мезень | Мезьда | мезенкса | ||
Number=Plur,Sing|PronType=Int | Мезень | мезьса |
VERB
109 VERB tokens (13% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Mood=EMPTY (109; 100%), Number[obj]=EMPTY (109; 100%), Person[obj]=EMPTY (109; 100%), Number[subj]=EMPTY (101; 93%), Person[subj]=EMPTY (101; 93%), Tense=EMPTY (98; 90%).
VERB
tokens may have the following values of Case
:
Abl
(14; 13% of non-emptyCase
): видемда, мяляфтан, валдашкодомда, ванфтомода, корхтамда, крфамда, лездомда, мяляфтат, тиемда, ужнамдаCau
(2; 2% of non-emptyCase
): работаманкса, сяськоманксаDat
(2; 2% of non-emptyCase
): саманцты, цяпаматиEla
(6; 6% of non-emptyCase
): лисемста, самста, Тумстост, завтракамста, мадомста, обедамста-ужнамстаGen
(12; 11% of non-emptyCase
): Авардемать, Кундафнень, Нумань, аноклайхть, морамаснон, пидефонц, покодемаснон, саманьконь, сялондыхнень, тушендомаснонIll
(3; 3% of non-emptyCase
): куломозон, самозост, тумозонзаLoc
(30; 28% of non-emptyCase
): куцема, работама, шурокстомома, азонкшнема, апрякама, ванондома, ватксема, вятемонза, лувома, морамаNom
(37; 34% of non-emptyCase
): Лядыхне, Содаф, азовомшка, анеляф, аноклама, ардомась, варьхмодема, кельгихть, кельгомнян, кенерьTra
(3; 3% of non-emptyCase
): сюдофокс, юкставикс, юкстафоксEMPTY
(711): архт, марявсь, моли, лиссь, сась, улема, варжакстсь, кармась, мольсь, рамась
Paradigm самс | Nom | Dat | Gen | Ill | Ela |
---|---|---|---|---|---|
_ | самста | ||||
Definite=Ind|Number=Sing|Number[subj]=Sing|PartForm=Past|Person[subj]=2|Tense=Pres|VerbForm=Part | сафат | ||||
Number=Sing|Number[psor]=Sing|Person[psor]=3|VerbForm=Vnoun | саманцты | ||||
Number=Plur,Sing|Number[psor]=Plur|Person[psor]=1|VerbForm=Vnoun | саманьконь | ||||
Number=Plur,Sing|Number[psor]=Plur|Person[psor]=3|VerbForm=Vnoun | самозост |
Case
seems to be lexical feature of VERB
. 92% lemmas (81) occur only with one value of Case
.
PROPN
82 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Definite=Ind (67; 82%), Number=Sing (63; 77%), Gender=EMPTY (58; 71%), Animacy=EMPTY (55; 67%).
PROPN
tokens may have the following values of Case
:
Dat
(4; 5% of non-emptyCase
): Валентинонди, Ванянди, Веряскинонди, ПетровичендиGen
(18; 22% of non-emptyCase
): Архипонь, Вельдинонь, Витянь, Девинонь, Злобинонь, Ивановать, Кокоревонь, Мокшеть, Николаевнань, ПашутьIne
(1; 1% of non-emptyCase
): ПарижсаNom
(58; 71% of non-emptyCase
): Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, ВарвараTra
(1; 1% of non-emptyCase
): ВасильевичексEMPTY
(1): Сашокть
Paradigm Петя | Nom | Gen |
---|---|---|
Number=Sing | Петя | |
Number=Plur,Sing | Петянь |
Case
seems to be lexical feature of PROPN
. 96% lemmas (67) occur only with one value of Case
.
ADP
69 ADP tokens (71% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=EMPTY (60; 87%), Number[psor]=EMPTY (53; 77%), Person[psor]=EMPTY (53; 77%).
ADP
tokens may have the following values of Case
:
Abl
(18; 26% of non-emptyCase
): эзда, фталда, ширде, эздон, эздонк, эздостCau
(4; 6% of non-emptyCase
): инксаCmp
(1; 1% of non-emptyCase
): эшкаEla
(3; 4% of non-emptyCase
): пингста, ваксстаIll
(18; 26% of non-emptyCase
): лангс, ваксс, коряс, малас, Корязост, корязон, корязонк, корязонт, эзонзаIne
(10; 14% of non-emptyCase
): эса, ваксса, лангса, каршесонк, эсовок, эсонза, эсостLat
(2; 3% of non-emptyCase
): алу, шириLoc
(7; 10% of non-emptyCase
): ала, Инголенк, Инголест, пильгалотPrl
(5; 7% of non-emptyCase
): мельгя, эзга, Мельгат, лангаст, мельгеTra
(1; 1% of non-emptyCase
): лангаEMPTY
(28): мархта, мархтонза, коряс, пачк, квалма, колга, корязост, перьф, перьфканза, сюнеда
Paradigm ланга | Tra | Ine | Ill | Prl |
---|---|---|---|---|
_ | лангса | лангс | ||
AdpType=Post|Number[psor]=Plur|Person[psor]=3 | лангаст | |||
NounType=Relat | ланга | лангс |
Case
seems to be lexical feature of ADP
. 96% lemmas (23) occur only with one value of Case
.
ADV
65 ADV tokens (15% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: AdvType=EMPTY (57; 88%).
ADV
tokens may have the following values of Case
:
Abl
(3; 5% of non-emptyCase
): вярде, ичкоздеCau
(1; 2% of non-emptyCase
): тянксаEla
(10; 15% of non-emptyCase
): тоста, Тяста, кати-коста, кой-коста, курокста, эста, коста, тязаGen
(1; 2% of non-emptyCase
): кафтоньIll
(6; 9% of non-emptyCase
): Коза, ламос, Мес, козовок, тязаIne
(13; 20% of non-emptyCase
): тоса, тяса, коса, маласа, Коса-бди, косовок, пяшксетольхтьLat
(16; 25% of non-emptyCase
): вяри, алу, ичкози, оду, фталу, мекиLoc
(12; 18% of non-emptyCase
): ичкозе, инголе, перьфпяле, ичкозятPrl
(3; 5% of non-emptyCase
): перьфпяльге, Шобдава, сяшкаваEMPTY
(366): нинге, пяк, кода, аньцек, сяда, ни, меле, тага, тячи, эста
Paradigm тяза | Ill | Ela |
---|---|---|
AdvType=Loc | тяза | |
PronType=Dem | тяза |
Case
seems to be lexical feature of ADV
. 97% lemmas (34) occur only with one value of Case
.
NUM
33 NUM tokens (89% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (29; 88%), Definite=Ind (28; 85%), Number=Sing (28; 85%).
NUM
tokens may have the following values of Case
:
Cmp
(3; 9% of non-emptyCase
): Кемоньшка, кеветиешка, нильгемоньшкаNom
(30; 91% of non-emptyCase
): кафта, фкя, колма, 225, 7, Кафттне, вете, кемотть, колмоцьке, комсьEMPTY
(4): фкя, вете, кафонц
Paradigm кемонь | Nom | Cmp |
---|---|---|
Definite=Ind|Number=Plur|NumType=Card | кемотть | |
Number=Plur,Sing | Кемоньшка |
Case
seems to be lexical feature of NUM
. 91% lemmas (10) occur only with one value of Case
.
DET
26 DET tokens (70% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number=Sing (25; 96%), Definite=Ind (20; 77%), PronType=EMPTY (18; 69%).
DET
tokens may have the following values of Case
:
Ill
(1; 4% of non-emptyCase
): ламосNom
(25; 96% of non-emptyCase
): эрь, лама, сембе, Тя, ся, иля, кодама-бъди, кой-кона, лия, тякаEMPTY
(11): ня, кафцьке, Мъзяра, Сяка, мзяра, сняра
Paradigm лама | Nom | Ill |
---|---|---|
Number=Sing | лама | |
Number=Plur,Sing | ламос |
Case
seems to be lexical feature of DET
. 92% lemmas (11) occur only with one value of Case
.
AUX
2 AUX tokens (1% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (2; 100%), Number[subj]=Sing (2; 100%), Person[subj]=3 (2; 100%), Polarity=Neg (2; 100%), Tense=Pres (2; 100%), VerbForm=EMPTY (2; 100%), VerbType=Aux (2; 100%).
AUX
tokens may have the following values of Case
:
Loc
(2; 100% of non-emptyCase
): ашEMPTY
(161): аф, ульсь, ашезь, апак, ашень, ба, ашеть, изь, катк, ли
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (73; 51%),
ADJ –[nsubj:cop]–> NOUN (28; 97%),
NOUN –[conj]–> NOUN (22; 92%),
NOUN –[nummod]–> NUM (17; 52%),
PROPN –[flat:name]–> PROPN (7; 78%),
ADJ –[conj]–> ADJ (5; 100%),
ADJ –[nsubj:cop]–> PROPN (5; 100%),
ADJ –[nsubj]–> NOUN (3; 100%),
NOUN –[nsubj]–> PRON (3; 75%),
ADJ –[amod]–> ADJ (2; 100%).