Treebank Statistics: UD_Albanian-STAF: Features: Case
This feature is universal.
It occurs with 5 different values: Abl
, Acc
, Dat
, Gen
, Nom
.
1285 tokens (36%) have a non-empty value of Case
.
705 types (58%) occur at least once with a non-empty value of Case
.
561 lemmas (57%) occur at least once with a non-empty value of Case
.
The feature is used with 5 part-of-speech tags: NOUN (601; 17% instances), PRON (332; 9% instances), ADJ (163; 5% instances), DET (157; 4% instances), PROPN (32; 1% instances).
NOUN
601 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (493; 82%), Gender=Fem (354; 59%), Definite=Def (349; 58%).
NOUN
tokens may have the following values of Case
:
Abl
(35; 6% of non-emptyCase
): ditës, kohësh, dëshire, filtrash, gjendjes, gjeneralit, grash, humbjeje, humbjes, kafkësAcc
(277; 46% of non-emptyCase
): sytë, ditë, fillim, arsye, dorën, fund, kohën, mend, mendjen, pyetjenDat
(5; 1% of non-emptyCase
): njerëzve, joshjeve, njeriu, ulërimësGen
(74; 12% of non-emptyCase
): borës, gjendjes, vetëdijes, merimangës, njerkës, shoqërisë, Gjumit, Sirenave, aeroportit, armëveNom
(210; 35% of non-emptyCase
): gjenerali, Nëna, prifti, shtëpia, babai, njeri, shi, vjeshta, dermani, fillimiEMPTY
(24): Mysafiri, babait, brejtja, djalë, errur, fillin, fundin, gjendje, here, ide
Paradigm njeri | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Definite=Def|Number=Plur | njerëzit | njerëzit | njerëzve | njerëzve |
Definite=Ind|Number=Sing | njeri, njeriu | njeriu | ||
Definite=Ind|Number=Plur | njerëz |
PRON
332 PRON tokens (77% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (274; 83%), PronType=Prs (247; 74%).
PRON
tokens may have the following values of Case
:
Abl
(15; 5% of non-emptyCase
): tyre, kësaj, meje, asaj, atyre, saj, tij, tim, tjerash, tjetritAcc
(142; 43% of non-emptyCase
): e, i, më, atë, këtë, mua, tjetër, të, saj, tijDat
(50; 15% of non-emptyCase
): i, më, na, atij, gjitha, mua, ti, uGen
(13; 4% of non-emptyCase
): sime, asaj, cilës, im, jonë, kujt, kësaj, saj, tij, tjetritNom
(112; 34% of non-emptyCase
): unë, ai, kjo, ky, ajo, cilët, im, tij, ata, imeEMPTY
(98): që, ç’, asgjë, diçka, e, më, ndonjë, asnjë, çdo, i
Paradigm unë | Nom | Acc | Dat | Gen | Abl |
---|---|---|---|---|---|
Gender=Masc|Person=1|Poss=Yes | im, unë | ||||
Gender=Masc|Person=1 | më | ||||
Person=1 | unë | mua, Më | më | im | meje |
Person=3 | meje |
ADJ
163 ADJ tokens (92% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (152; 93%), Number=Sing (132; 81%), Gender=Fem (102; 63%).
ADJ
tokens may have the following values of Case
:
Abl
(5; 3% of non-emptyCase
): fundit, jashtëzakonshme, mundshëm, okultë, porsaardhurAcc
(63; 39% of non-emptyCase
): bardhë, djathtë, fundit, gabuar, majtë, parë, alternative, botërore, dashtun, dinjitozeGen
(12; 7% of non-emptyCase
): bardhë, ardhshëm, arsyeshëm, automobilistike, dashtunës, errët, jashtëzakonshme, para, plotë, riNom
(83; 51% of non-emptyCase
): bukur, huaj, parë, sigurt, bardhë, fundit, papritur, qetë, re, MadhEMPTY
(15): dytë, fundit, hijerëndë, imperiale, kureshtar, lodhun, relative, rrallë, saktë, shqiptari
Paradigm bardhë | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing | bardhë | bardhë | |
Gender=Fem|Number=Sing | bardhë | bardhë | bardhë |
Gender=Fem|Number=Plur | bardha |
DET
157 DET tokens (52% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Definite=EMPTY (157; 100%), PronType=Art (156; 99%), Number=Sing (126; 80%), Gender=Fem (92; 59%).
DET
tokens may have the following values of Case
:
Abl
(6; 4% of non-emptyCase
): të, sëAcc
(67; 43% of non-emptyCase
): të, e, iDat
(1; 1% of non-emptyCase
): tëGen
(16; 10% of non-emptyCase
): të, sëNom
(67; 43% of non-emptyCase
): e, i, tëEMPTY
(143): një, e, të, i, së, nja, pak
Paradigm të | Nom | Acc | Dat | Gen | Abl |
---|---|---|---|---|---|
Gender=Masc|Number=Sing | të | të | të | ||
Gender=Masc|Number=Plur | të | të | të | ||
Gender=Fem|Number=Sing | të | të | të | ||
Gender=Fem|Number=Plur | të | të | të | të | të |
PROPN
32 PROPN tokens (82% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (30; 94%), Definite=Def (24; 75%), Gender=Masc (20; 63%).
PROPN
tokens may have the following values of Case
:
Acc
(10; 31% of non-emptyCase
): Shqipëri, Berti, Ervehenë, Hadin, Lorin, Margën, Tibet, VajazanDat
(2; 6% of non-emptyCase
): ErnestitGen
(5; 16% of non-emptyCase
): Varrit, Dizit, Ernestit, Shqipërisë, VedatitNom
(15; 47% of non-emptyCase
): Ernesti, Linda, Vedati, Ernest, Hadi, Marga, Margës, Parku, Vedat, shtunëEMPTY
(7): Bamit, Dizi, Dizin, Ernesti, Lindën, Nerminja, Odise
Paradigm Ernest | Nom | Dat | Gen |
---|---|---|---|
Definite=Def | Ernesti | Ernestit | Ernestit |
Definite=Ind | Ernest |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
ADJ –[det:adj]–> DET (109; 92%),
NOUN –[amod]–> ADJ (107; 91%),
NOUN –[det:poss]–> PRON (31; 91%),
NOUN –[det]–> PRON (27; 53%),
NOUN –[conj]–> NOUN (20; 69%),
ADJ –[det]–> DET (13; 72%),
NOUN –[nmod:poss]–> PRON (6; 75%),
PRON –[det:pron]–> DET (6; 67%),
ADJ –[conj]–> ADJ (5; 100%),
ADJ –[nsubj]–> NOUN (5; 83%).