Treebank Statistics: UD_Sinhala-STB: Features: Case
This feature is universal but the values Cns
are language-specific.
It occurs with 11 different values: Abl
, Acc
, Ben
, Cns
, Dat
, Gen
, Ill
, Ine
, Ins
, Loc
, Nom
.
346 tokens (39%) have a non-empty value of Case
.
276 types (55%) occur at least once with a non-empty value of Case
.
243 lemmas (58%) occur at least once with a non-empty value of Case
.
The feature is used with 3 part-of-speech tags: NOUN (280; 32% instances), PRON (35; 4% instances), PROPN (31; 4% instances).
NOUN
280 NOUN tokens (91% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Animacy=EMPTY (214; 76%), Gender=Neut (181; 65%), Number=Sing (168; 60%).
NOUN
tokens may have the following values of Case
:
Abl
(4; 1% of non-emptyCase
): අතින්, ඉරානයෙන්, ඡන්දයෙන්, පිට්ටනියෙන්Acc
(87; 31% of non-emptyCase
): කිරීම, ජනතාව, ප්රධානයකු, රට, හැඟීමක්, අදහස, අදහසක්, අදියර, අයවැය, ආණ්ඩුවBen
(1; 0% of non-emptyCase
): ජනතාවටCns
(4; 1% of non-emptyCase
): කොමිස්වලට, ගිවිසුමට, රටට, ලංකාවටDat
(11; 4% of non-emptyCase
): ජනතාවට, අධිපතිවරයාට, දේශප්රේමීන්ට, නායකයකුට, පක්ෂයට, බවට, මහතාට, මෙරටට, මෙහෙයුම්වලට, සංවිධානයටGen
(12; 4% of non-emptyCase
): හමුදාවේ, ආසියාවේ, උපායෙහි, කරගැනීමේ, ක්රමයේ, ජාතියේ, මණ්ඩලයේ, ලෝකයේ, වන්නියේ, ශිල්පයෙහිIll
(1; 0% of non-emptyCase
): ආරාමවලටIne
(13; 5% of non-emptyCase
): අත්අඩංගුවේ, කේන්ද්රස්ථානයක, ජපානයේ, නගරයේ, ප්රදේශවල, මධ්යයේ, මෙරට, රාජ්යයක, රාජ්යයේ, ලිපියකIns
(7; 3% of non-emptyCase
): ක්රමය, කාලයකින්, කිරෙන්, කිහිපයකින්, පරිත්යාගයෙන්, ලේඛනයෙනි, වීමෙන්Loc
(6; 2% of non-emptyCase
): ආසන්නයේ, කලාපයෙකි, තත්ත්වයක, මොහොතේ, වටරවුමේ, විද්යාවේNom
(134; 48% of non-emptyCase
): ආර්ථික, අද, මහතා, දේශපාලන, තත්ත්වය, යුද, අය, අයථා, අයවැය, අවසන්EMPTY
(28): සිදු, අහෝසි, අනිවාර්ය, ඉන්දියන්, උදා, කලකට, කිරීම, කෙළ, ගණනාවක්, ගැනීම
Paradigm ජනතා | Nom | Acc | Dat | Ben |
---|---|---|---|---|
Animacy=Anim | ජනතා | |||
Animacy=Anim|Definite=Def | ජනතාවට | |||
Animacy=Anim|Definite=Def|Number=Sing | ජනතාව | |||
Animacy=Anim|Number=Sing | ජනතාවට | |||
Definite=Def|Gender=Masc|Number=Sing | ජනතාව | ජනතාව |
PRON
35 PRON tokens (80% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Poss=EMPTY (35; 100%), Person=EMPTY (30; 86%), Animacy=EMPTY (28; 80%), Number=Sing (25; 71%), PronType=Dem (19; 54%).
PRON
tokens may have the following values of Case
:
Abl
(1; 3% of non-emptyCase
): ඉන්Acc
(5; 14% of non-emptyCase
): ඒ, එකිනෙකා, එය, ඔවුන්Dat
(7; 20% of non-emptyCase
): ඊට, ඔහුට, අපට, ඔවුනට, මීටLoc
(3; 9% of non-emptyCase
): එහිNom
(19; 54% of non-emptyCase
): ඔහු, එය, ඒ, ඔව්හු, කිහිපයක්, මෙයEMPTY
(9): ඒ, සිය, අප, අපේ, එම, තම, මේ
Paradigm එය | Nom | Acc | Dat | Loc | Abl |
---|---|---|---|---|---|
Animacy=Inan|Gender=Neut | ඊට | ||||
Animacy=Inan|Number=Sing | එය | ||||
Gender=Neut|Number=Sing | එය | එය | ඉන් | ||
Number=Sing | එය | එහි |
PROPN
31 PROPN tokens (82% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Foreign=EMPTY (29; 94%), Number=Sing (28; 90%), Animacy=EMPTY (23; 74%), Definite=EMPTY (19; 61%), Person=EMPTY (17; 55%).
PROPN
tokens may have the following values of Case
:
Acc
(7; 23% of non-emptyCase
): ඉරානය, චීනය, ටැන්සානියාව, පලස්තීනය, ලංකාව, සර්බියානු, සිංගප්පූරුවDat
(1; 3% of non-emptyCase
): ලංකාවටGen
(1; 3% of non-emptyCase
): අමෙරිකාවේNom
(22; 71% of non-emptyCase
): මහින්ද, යුනෙස්කෝ, රනිල්, රාජපක්ෂ, ලංකාව, ලිප්ටන්, වික්රමසිංහ, ෆොන්සේකා, ඉන්දියාව, ජුලියස්EMPTY
(7): ශ්රී, කොසෝවෝ, ෂැවොලින්
Paradigm ලංකා | Nom | Acc | Dat |
---|---|---|---|
Definite=Def | ලංකාව | ලංකාවට | |
Definite=Ind | ලංකාවක් | ||
ලංකාව |
Case
seems to be lexical feature of PROPN
. 95% lemmas (21) occur only with one value of Case
.
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
PROPN –[flat]–> NOUN (6; 75%),
PROPN –[flat]–> PROPN (6; 67%),
NOUN –[nsubj]–> PROPN (3; 60%),
NOUN –[compound:prt]–> NOUN (1; 100%),
NOUN –[conj]–> NOUN (1; 100%),
NOUN –[flat]–> NOUN (1; 100%),
NOUN –[obl:lmod]–> PROPN (1; 100%),
PRON –[nmod]–> NOUN (1; 100%),
PROPN –[conj]–> PROPN (1; 100%).