Treebank Statistics: UD_Kazakh-KTB: Features: Case
This feature is universal.
It occurs with 7 different values: Abl
, Acc
, Dat
, Gen
, Ins
, Loc
, Nom
.
4467 tokens (42%) have a non-empty value of Case
.
2920 types (67%) occur at least once with a non-empty value of Case
.
1525 lemmas (63%) occur at least once with a non-empty value of Case
.
The feature is used with 10 part-of-speech tags: NOUN (2999; 28% instances), PROPN (562; 5% instances), PRON (476; 5% instances), VERB (275; 3% instances), ADJ (48; 0% instances), NUM (46; 0% instances), AUX (42; 0% instances), ADV (14; 0% instances), DET (3; 0% instances), ADP (2; 0% instances).
NOUN
2999 NOUN tokens (97% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=EMPTY (2601; 87%), Number[psor]=EMPTY (1867; 62%), Person[psor]=EMPTY (1867; 62%).
NOUN
tokens may have the following values of Case
:
Abl
(132; 4% of non-emptyCase
): жылдан, футболдан, Соғыстан, ауылдан, дүниеден, елден, күннен, пендеден, шеттен, ғасырданAcc
(257; 9% of non-emptyCase
): тілдерін, жобаны, сөзді, чемпионатты, қызды, малын, ахуалды, бейбітшілікті, дыбысты, елдіDat
(308; 10% of non-emptyCase
): жерге, үйге, адамға, жылға, дағдарысқа, дүниеге, елге, пайызға, тысқа, аймаққаGen
(297; 10% of non-emptyCase
): жылдың, ғасырдың, халықтың, адамның, елдің, Жобаның, ағаштың, еліміздің, қазақтың, қаланыңIns
(78; 3% of non-emptyCase
): сезіммен, Асумен, Жорғалықпенен, Күнмен, Нашақорлықпен, Патшамен, Тәсілмен, абыроймен, ерлікпен, жолменLoc
(299; 10% of non-emptyCase
): елде, ғасырда, түрде, елдегі, кезде, жерде, арасында, кезінде, баспасөзде, бақшадаNom
(1628; 54% of non-emptyCase
): мемлекет, ел, орыс, қазақ, Президент, адам, бала, кісі, мал, орынEMPTY
(101): ж., М., б.з.б., млрд., бала, млн., т.б., А., Р., тастай
Paradigm ел | Nom | Acc | Dat | Gen | Loc | Ins | Abl |
---|---|---|---|---|---|---|---|
_ | ел | елді | елге | елдің | елде, елдегі | елден | |
Number=Plur | елдер | елдерді | елдерден | ||||
Number=Plur|Number[psor]=Sing|Person[psor]=2|Polite=Form | елдеріңіз | ||||||
Number=Plur|Number[psor]=Plur,Sing|Person[psor]=3 | елдері | елдерінде | елдерімен | ||||
Number=Plur|Number[psor]=Plur|Person[psor]=1 | елдеріміз | ||||||
Number[psor]=Sing|Person[psor]=2 | еліңе | ||||||
Number[psor]=Sing|Person[psor]=2|Polite=Form | еліңіз | ||||||
Number[psor]=Plur,Sing|Person[psor]=3 | елі | Еліне | елінің | ||||
Number[psor]=Plur|Person[psor]=1 | еліміз | елімізге | еліміздің | Еліміздегі, елімізде |
PROPN
562 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Gender=EMPTY (369; 66%).
PROPN
tokens may have the following values of Case
:
Abl
(7; 1% of non-emptyCase
): Азиядан, Астанадан, Германиядан, Сұзыдан, Айгүлден, ТөлегенненAcc
(15; 3% of non-emptyCase
): Иранды, Азаматты, Арабияны, Мысырды, Палестинаны, Сирияны, Қазақстанды, ҚожанасырдыDat
(24; 4% of non-emptyCase
): Астанаға, Иранға, Қазақстанға, Арменияға, Бағдадқа, Византияға, Германияға, Семейге, Тибетке, УкраинағаGen
(65; 12% of non-emptyCase
): Қазақстанның, Иранның, Астананың, Ерназардың, Азаматтың, Азияның, Еуропаның, Айгүлдің, Алматының, БекболаттыңIns
(7; 1% of non-emptyCase
): АҚШ-пен, Ауғанстанмен, Грузиямен, Қазақстанмен, Өзбекстанмен, НазарбаевпенLoc
(36; 6% of non-emptyCase
): Қазақстанда, Астанада, Тегеранда, Қазақстандағы, Алматыда, Бразилияда, Иранда, Азияда, Азиядағы, АмерикадаNom
(408; 73% of non-emptyCase
): Иран, Қазақстан, АҚШ, Алматы, Астана, Бекболат, Азамат, Нұрсұлтан, Ұлыбритания, Айгүл
Paradigm Қазақстан | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Қазақстан | Қазақстанды | Қазақстанға | Қазақстанның | Қазақстанда, Қазақстандағы | Қазақстанмен |
PRON
476 PRON tokens (97% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (267; 56%).
PRON
tokens may have the following values of Case
:
Abl
(19; 4% of non-emptyCase
): одан, онан, содан, Бірінен, Менен, Мұнан, Неліктен, Сізден, осыданAcc
(50; 11% of non-emptyCase
): оны, сені, бізді, Мені, Сізді, Ешкімді, Кімді, Сіздерді, бәрін, олардыDat
(40; 8% of non-emptyCase
): оған, маған, кімге, саған, Соған, бізге, ешкімге, оларға, сізге, сіздергеGen
(87; 18% of non-emptyCase
): біздің, оның, сіздің, олардың, соның, өзінің, менің, мұның, өзіміздің, АныңIns
(9; 2% of non-emptyCase
): осымен, Онымен, Сізбен, бір-бірімен, бұлармен, кіммен, немен, сонымененLoc
(19; 4% of non-emptyCase
): мұнда, Сізде, осында, өзінде, онда, Бізде, Менде, сондаNom
(252; 53% of non-emptyCase
): біз, мен, ол, бұл, не, кім, олар, өзі, ешкім, бәріEMPTY
(17): қандай, олай, өзінше, Меніңше, Осылай, Содан, былай, ешқандай, манағыдай, солай
Paradigm ол | Nom | Acc | Dat | Gen | Loc | Ins | Abl |
---|---|---|---|---|---|---|---|
Number=Sing|Person=3|PronType=Prs | ол, О | оны | оған | оның, Аның | Онымен | одан | |
Number[psor]=Plur,Sing|Person[psor]=3|PronType=Dem | Онысы | ||||||
PronType=Dem | ол | оны | оған | оның | онда | одан, онан |
VERB
275 VERB tokens (17% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Person=EMPTY (275; 100%), Mood=EMPTY (274; 100%), Number=EMPTY (271; 99%), VerbForm=Ger (271; 99%), Aspect=EMPTY (270; 98%), Voice=EMPTY (230; 84%), Tense=EMPTY (199; 72%).
VERB
tokens may have the following values of Case
:
Abl
(13; 5% of non-emptyCase
): кеткеннен, алмастан, басталғаннан, бақылаудан, біткеннен, жетіспеушілігінен, жолыққаннан, жөндеуден, сөйлегеннен, тұрғызылғандықтанAcc
(23; 8% of non-emptyCase
): біткенді, ойнағанды, алуды, алғанын, білгенді, демократияландыруды, етуді, жазылмасын, жолдауыңызды, жымиғанынDat
(76; 28% of non-emptyCase
): алуға, қорғалуға, атауға, білуге, орнатуға, табуға, тұруға, Блоктарға, азапталуға, айналуғаGen
(7; 3% of non-emptyCase
): жүргізудің, тартудың, теңелуінің, тырысуының, қосылудың, қосылуының, әкелудіңIns
(10; 4% of non-emptyCase
): берумен, болуымен, бояумен, жеумен, кигенмен, оқығанменен, сайлануыңызбен, сорумен, қаруымен, өткізілуіменLoc
(25; 9% of non-emptyCase
): келгенде, салыстырғанда, Сөйткенде, араздасқанда, асқанда, ашқанда, дамуда, дамытуда, дегенде, жүргендеNom
(121; 44% of non-emptyCase
): жасау, келген, оқу, шешуі, алу, асыру, ашылу, көрсету, салу, сақтауEMPTY
(1368): деп, бастады, кетті, деді, алып, біледі, болды, бастап, келді, шықты
Paradigm ал | Nom | Acc | Dat | Abl |
---|---|---|---|---|
Number[psor]=Plur,Sing|Person[psor]=3|Tense=Past | алғанын | |||
Number[psor]=Plur,Sing|Person[psor]=3 | алуы | |||
Polarity=Neg|Tense=Fut | алмастан | |||
алу | алуды | алуға |
ADJ
48 ADJ tokens (6% of all ADJ
tokens) have a non-empty value of Case
.
ADJ
tokens may have the following values of Case
:
Abl
(5; 10% of non-emptyCase
): алыстан, жаңадан, күштіден, көптен, жартысынанAcc
(9; 19% of non-emptyCase
): талайды, өзгені, Солтүстік-батысын, Турасын, баршаларын, барыңды, оңтүстігін, солтүстік-шығысын, өзгесінDat
(3; 6% of non-emptyCase
): алысқа, жайға, жылдығынаGen
(6; 13% of non-emptyCase
): ақтардың, жаттың, туындының, жылдығыныңLoc
(4; 8% of non-emptyCase
): аулақта, жартысында, АнығындаNom
(21; 44% of non-emptyCase
): бар, атты, дауысты, жақын, жоқ, жуығы, көп, түркі, Ақтар, баршасыEMPTY
(779): бар, үлкен, керек, жаңа, жоқ, тиіс, жақсы, ұлттық, экономикалық, басқа
Paradigm бар | Nom | Acc |
---|---|---|
_ | бар | |
Number[psor]=Sing|Person[psor]=2 | барыңды |
NUM
46 NUM tokens (12% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card,Ord (27; 59%).
NUM
tokens may have the following values of Case
:
Abl
(6; 13% of non-emptyCase
): бірінен, 2°С-тан, миллионнан, мыңнан, қырықтанAcc
(2; 4% of non-emptyCase
): 70%-ін, БірінDat
(6; 13% of non-emptyCase
): 100-ге, 19,4°С-қа, 400-ге, 80-ге, 90%-ына, 90%-ғаGen
(3; 7% of non-emptyCase
): екеуініңLoc
(1; 2% of non-emptyCase
): 35-теNom
(28; 61% of non-emptyCase
): бірі, екеуі, 2030, 22%-ы, 27%, 30%, 36%-ы, 5%, 51%, 58,3%EMPTY
(328): бір, екі, миллиард, 1, 12, 2, 11, 20, үш, 18
Paradigm бір | Nom | Acc | Abl |
---|---|---|---|
Number[psor]=Plur,Sing|NumType=Card,Ord|Person[psor]=3 | бірі | Бірін | бірінен |
Number[psor]=Plur,Sing|NumType=Card|Person[psor]=3 | бірі | ||
NumType=Card | бір |
Case
seems to be lexical feature of NUM
. 92% lemmas (23) occur only with one value of Case
.
AUX
42 AUX tokens (12% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (42; 100%), Number=EMPTY (42; 100%), Person=EMPTY (42; 100%), VerbForm=Ger (42; 100%), Aspect=EMPTY (40; 95%), Polarity=EMPTY (40; 95%), Tense=Past (25; 60%).
AUX
tokens may have the following values of Case
:
Abl
(2; 5% of non-emptyCase
): алғаннан, болғандықтанAcc
(12; 29% of non-emptyCase
): екенін, болғанын, болмасымды, болғанымды, екендіктерін, жатқанын, жүргенінDat
(9; 21% of non-emptyCase
): болуға, алатынына, алғаныма, болғаныма, екеніне, тұруға, қалғанынаIns
(1; 2% of non-emptyCase
): екеніменLoc
(4; 10% of non-emptyCase
): болғанда, алмауда, жүргендеNom
(14; 33% of non-emptyCase
): болуы, болу, болатыны, болған, екені, жатқаны, жүрген, отырғаным, қалғанEMPTY
(319): болып, болды, еді, жатыр, емес, келеді, отыр, екен, болады, жатқан
Paradigm бол | Nom | Acc | Dat | Loc | Abl |
---|---|---|---|---|---|
Aspect=Imp|Number[psor]=Plur,Sing|Person[psor]=3 | болатыны | ||||
Number[psor]=Sing|Person[psor]=1|Polarity=Neg|Tense=Fut | болмасымды | ||||
Number[psor]=Sing|Person[psor]=1|Tense=Past | болғанымды | болғаныма | |||
Number[psor]=Plur,Sing|Person[psor]=3|Tense=Past | болғанын | ||||
Number[psor]=Plur,Sing|Person[psor]=3 | болуы | ||||
Tense=Past | болған | болғанда | |||
болу | болуға | болғандықтан |
ADV
14 ADV tokens (5% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: PronType=EMPTY (13; 93%).
ADV
tokens may have the following values of Case
:
Nom
(14; 100% of non-emptyCase
): қазіргі, соңғы, Арғы, Бүгінгі, Ендігі, Жоғарғы, бергі, биылғы, ежелгі, күндізгіEMPTY
(290): да, де, қайда, бүгін, енді, тағы, ғана, қазір, қайдан, өте
Case
seems to be lexical feature of ADV
. 100% lemmas (11) occur only with one value of Case
.
DET
3 DET tokens (1% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: PronType=Int (3; 100%).
DET
tokens may have the following values of Case
:
Nom
(3; 100% of non-emptyCase
): неEMPTY
(217): осы, бұл, бір, өз, ол, сол, барлық, әр, мына, бүкіл
ADP
2 ADP tokens (1% of all ADP
tokens) have a non-empty value of Case
.
ADP
tokens may have the following values of Case
:
Nom
(2; 100% of non-emptyCase
): дейінгі, кейінгіEMPTY
(173): үшін, кейін, бойынша, соң, қарсы, дейін, лы, қарай, басқа, сайын
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[conj]–> NOUN (133; 86%),
NOUN –[nsubj]–> NOUN (52; 69%),
NOUN –[compound]–> NOUN (40; 61%),
PROPN –[conj]–> PROPN (39; 89%),
PROPN –[flat:name]–> PROPN (32; 76%),
NOUN –[nsubj]–> PRON (25; 89%),
NOUN –[appos]–> NOUN (20; 69%),
NOUN –[appos]–> PROPN (17; 71%),
NOUN –[nsubj]–> PROPN (14; 88%),
VERB –[conj]–> VERB (14; 93%).