Treebank Statistics: UD_Urdu-UDTB: Features: Case
This feature is universal.
It occurs with 6 different values: Acc
, Dat
, Erg
, Gen
, Ins
, Nom
.
Some words have combined values of the feature; 4 combinations have been observed: Acc|Dat
, Acc|Erg
, Acc|Gen
, Acc|Ins
.
75764 tokens (55%) have a non-empty value of Case
.
9226 types (85%) occur at least once with a non-empty value of Case
.
8530 lemmas (89%) occur at least once with a non-empty value of Case
.
The feature is used with 14 part-of-speech tags: NOUN (32674; 24% instances), PROPN (17052; 12% instances), ADP (10578; 8% instances), ADJ (5933; 4% instances), PRON (5187; 4% instances), DET (1954; 1% instances), VERB (1611; 1% instances), ADV (475; 0% instances), AUX (135; 0% instances), NUM (94; 0% instances), PART (55; 0% instances), SCONJ (7; 0% instances), CCONJ (5; 0% instances), X (4; 0% instances).
NOUN
32674 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Person=3 (32430; 99%), Number=Sing (27395; 84%), Gender=Masc (26421; 81%).
NOUN
tokens may have the following values of Case
:
Acc
(17199; 53% of non-emptyCase
): حکومت، عوام، پولیس، طور، انتخابات، ملک، عہدیداروں، عمل، اجلاس، پارٹیNom
(15475; 47% of non-emptyCase
): حاصل، آج، بات، کام، پولیس، وزیر، چیف، وقت، ضلع، ڈاکٹرEMPTY
(295): اللہ، علیہ، صلی، وسلم، رضی، مرحوم، عائد، عنہ، قرار، نقصان
Paradigm حکومت | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | حکومت | حکومت |
Gender=Masc|Number=Plur | حکومتیں | حکومتوں |
Gender=Fem|Number=Sing | حکومت | حکومت |
Gender=Fem|Number=Plur | حکومتیں | حکومتوں, حکومتیں |
PROPN
17052 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Person=3 (17025; 100%), Number=Sing (16974; 100%), Gender=Masc (16235; 95%).
PROPN
tokens may have the following values of Case
:
Acc
(7128; 42% of non-emptyCase
): کانگریس، ہندوستان، ریڈی، سنگھ، پاکستان، پی، امریکہ، آئی، مئی، اپریلNom
(9924; 58% of non-emptyCase
): پی، سی، بی، ایس، آئی، ٹی، ڈی، محمد، آر، جےEMPTY
(83): برائے، و، -، 27، ایک، 09، 2009، 25، 28، 29
Paradigm پی | Nom | Acc |
---|---|---|
Gender=Masc | پی, بی | پی |
Gender=Fem | پی | پی |
ADP
10578 ADP tokens (38% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: Number=Sing (10092; 95%), AdpType=Post (9978; 94%), Gender=Masc (6666; 63%).
ADP
tokens may have the following values of Case
:
Acc
(4879; 46% of non-emptyCase
): کے، کی، کا، جانب، وجہ، بارے، تعلق، حیثیت، مےں، طرفNom
(5699; 54% of non-emptyCase
): کی، کا، بعد، ساتھ، کے، دوران، جانب، خلاف، قبل، ذریعہEMPTY
(17228): نے، سے، کے، مےں، کو، پر، میں، لیے، تک، لئے
Paradigm کا | Nom | Acc |
---|---|---|
AdpType=Post|Gender=Masc|Number=Sing | کا, کے, کی | کے, کا, کی, سے, نے |
AdpType=Post|Gender=Masc|Number=Sing|Person=3 | کا, کے | |
AdpType=Post|Gender=Masc|Number=Sing|Person=3|Polite=Form | کے | کے |
AdpType=Post|Gender=Masc|Number=Plur | کے | کے |
AdpType=Post|Gender=Masc|Number=Plur|Person=3 | کے | |
AdpType=Post|Gender=Masc|Number=Plur|Person=3|Polite=Form | کے | کے |
AdpType=Post|Gender=Fem | کی | |
AdpType=Post|Gender=Fem|Number=Sing | کی, کا, کو, کے | کی, کے, والی, کا |
AdpType=Post|Gender=Fem|Number=Sing|Person=3 | کی | |
AdpType=Post|Gender=Fem|Number=Plur | کی | کی |
AdpType=Post|Number=Sing | کا | |
AdpType=Post|Number=Sing|Person=3 | کو | |
AdpType=Post|Number=Plur | کے | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part | کی | |
Gender=Masc | کے | |
Gender=Masc|Number=Sing | کے | کے |
Gender=Masc|Number=Plur | کے | |
Gender=Fem|Number=Sing | کی |
ADJ
5933 ADJ tokens (56% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=EMPTY (4802; 81%), Gender=EMPTY (4692; 79%).
ADJ
tokens may have the following values of Case
:
Acc
(3336; 56% of non-emptyCase
): والے، سرکاری، سابق، دیگر، مختلف، ریاستی، مقامی، سیاسی، تمام، امریکیNom
(2597; 44% of non-emptyCase
): سابق، گزشتہ، سخت، اہم، شدید، ریاستی، بہترین، دیگر، سیاسی، تمامEMPTY
(4582): جاری، شامل، موجود، پیدا، ہلاک، منعقد، ظاہر، فراہم، قائم، واضح
Paradigm والا | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | والا, والے | والے, والا |
Gender=Masc|Number=Sing|Person=3 | والا | والا |
Gender=Masc|Number=Plur | والے | والے, والوں |
Gender=Fem | والی | والی |
Gender=Fem|Number=Sing | والی | والی |
Number=Sing | والی |
PRON
5187 PRON tokens (93% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (5102; 98%), Gender=EMPTY (4591; 89%), Polite=EMPTY (4433; 85%), Person=3 (3742; 72%), Number=Sing (3505; 68%).
PRON
tokens may have the following values of Case
:
Acc
(2656; 51% of non-emptyCase
): اس، ان، انہوں، جس، اپنے، اپنی، کسی، انھوں، جن، آپAcc,Dat
(365; 7% of non-emptyCase
): انہیں، اسے، انھیں، جسے، انہوں، ہمیں، مجھے، جنہیں، میرے، اُنھیںAcc,Gen
(35; 1% of non-emptyCase
): ان، ہم، میری، میرا، اس، جس، میرے، ہمارےAcc,Ins
(3; 0% of non-emptyCase
): ازیںNom
(2128; 41% of non-emptyCase
): وہ، جو، یہ، کوئی، اب، یہاں، اپنے، جب، اپنی، جہاںEMPTY
(410): سب، جو، خود، تو، کیا، اب، جب، کچھ، کیوں، انہوں
Paradigm یہ | Acc,Dat | Acc,Gen | Acc,Ins | Nom | Acc |
---|---|---|---|---|---|
Gender=Masc|Number=Sing|Person=3|Polite=Form|Poss=Yes|PronType=Prs | ان | ||||
Gender=Masc|Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں, انھیں, اُنھیں | ان | |||
Gender=Masc|Number=Sing|Person=3|PronType=Prs | انہیں | اس | |||
Gender=Masc|Number=Plur|Person=3|Polite=Form|PronType=Prs | انہیں, انھیں | انہوں | |||
Gender=Masc|Number=Plur|Person=3|PronType=Prs | انہیں | ||||
Gender=Fem|Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں | ||||
Gender=Fem|Number=Sing|Person=3|PronType=Dem | اسی | ||||
Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں, اِنھیں | انہیں | ان | ||
Number=Sing|Person=3|Poss=Yes|PronType=Prs | اس, ان | ||||
Number=Sing|Person=3|PronType=Dem | اس, یہ | اس, ان | |||
Number=Sing|Person=3|PronType=Prs | اسے, انہیں | یہ, اس, ان, یہی | اس, ان, اسی, اِس, اسے, یہ | ||
Number=Sing|PronType=Prs | اسی, یہی | ||||
Number=Plur|Person=3|Polite=Form|Poss=Yes|PronType=Prs | ان | ||||
Number=Plur|Person=3|Polite=Form|PronType=Prs | انہیں, ان | ان | |||
Number=Plur|Person=3|Poss=Yes|PronType=Prs | ان | ||||
Number=Plur|Person=3|PronType=Dem | ان | ||||
Number=Plur|Person=3|PronType=Prs | انہیں | یہ, ان, انھیں | ان, یہ | ||
Person=3|Polite=Form|PronType=Prs | انہیں | انہیں | |||
Person=3|PronType=Prs | یہی | ||||
PronType=Prs | ازیں | یہاں, یہ, یہی | ازیں, اسی |
DET
1954 DET tokens (78% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: PronType=Dem (1867; 96%), Person=3 (1775; 91%), Number=Sing (1671; 86%).
DET
tokens may have the following values of Case
:
Acc
(1045; 53% of non-emptyCase
): اس، ان، ایسے، اسی، دیگر، کسی، جن، جس، ایسی، اُسAcc,Dat
(1; 0% of non-emptyCase
): ہمNom
(908; 46% of non-emptyCase
): یہ، اس، اسی، کوئی، جو، وہ، ان، ایسے، ایسا، یہیEMPTY
(542): کئی، تمام، کچھ، ہر، چند، بعض، زیادہ، کم، بہت، کیا
Paradigm یہ | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing|Person=3 | یہ, اسی | |
Gender=Masc|Number=Sing | اس, اسی | اسی |
Gender=Fem|Number=Sing | اسی | اسی |
Gender=Fem|Number=Plur | ایسی | ایسی |
Number=Sing|Person=3 | یہ, اس, اسی, یہی, ان, اِس | اس, ان, اسی, یہ, یہی |
Number=Sing | اسی, یہی | اسی |
Number=Plur|Person=3 | یہ, ان, اِن | ان, اس |
Number=Plur | ان | |
اسی, یہی, اس | اسی |
VERB
1611 VERB tokens (13% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Person=EMPTY (1585; 98%), Aspect=EMPTY (1565; 97%), Voice=EMPTY (1546; 96%), Number=EMPTY (1512; 94%), Gender=EMPTY (1501; 93%), VerbForm=Inf (1499; 93%).
VERB
tokens may have the following values of Case
:
Acc
(1521; 94% of non-emptyCase
): کرنے، ہونے، دینے، رکھنے، بنانے، لینے، آنے، رہنے، جانے، لگانےNom
(90; 6% of non-emptyCase
): کی، دیا، کرنے، کرنا، جانا، پڑھنا، کر، کھیل، گھرے، آنےEMPTY
(11084): کیا، کہا، کر، کی، ہو، دیا، کرتے، ہے، دی، بتایا
Paradigm کرنا | Nom | Acc |
---|---|---|
_ | کر, کی | |
Aspect=Perf|Gender=Masc|Number=Sing|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Gender=Masc|Number=Sing|VerbForm=Part | کئے, کیے | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part | کی | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|Number=Sing|VerbForm=Part | کیے | |
Aspect=Perf|Person=3|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|VerbForm=Part | کئے, کرنے, کی, کیے | |
Gender=Masc|Number=Sing|VerbForm=Inf | کرنا | |
Gender=Masc|Number=Plur|Person=3|Voice=Act | کر | |
Gender=Masc|Number=Plur|VerbForm=Inf | کرنے | |
Gender=Masc|VerbForm=Inf | کرنے | کرنے |
Gender=Fem|Number=Sing|Person=3|Voice=Pass | کی | |
Gender=Fem|Number=Sing|Voice=Act | کی | |
Number=Plur|VerbForm=Inf | کرنے | |
VerbForm=Inf | کرنے, کرنا | کرنے, کرنا, کیے, کی |
VerbForm=Inf|Voice=Act | کرنے, کرنا | |
VerbForm=Inf|Voice=Pass | کرنے | |
Voice=Act | کر |
ADV
475 ADV tokens (34% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: AdvType=EMPTY (474; 100%), Number=Sing (435; 92%), Gender=Masc (433; 91%), Person=3 (410; 86%), AdpType=Post (371; 78%).
ADV
tokens may have the following values of Case
:
Acc
(45; 9% of non-emptyCase
): جانب، پہلے، بعد، خاصکر، دن، اندر، زاید، سب، قبل_ازیں، کلیدیNom
(430; 91% of non-emptyCase
): پیش، بعد، پہلے، دوران، طرف، آگے، باہر، جانب، سامنے، قبلEMPTY
(911): پھر، بہت، سے، پیش، مزید، دوبارہ، انتہائی، جلد، ہمیشہ، ہنوز
Paradigm بعد | Nom | Acc |
---|---|---|
AdpType=Post | بعد | |
AdpType=Post|Person=3 | بعد, بعدازاں | بعد |
Person=3 | بعد, بعدازاں | بعد |
AUX
135 AUX tokens (1% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (134; 99%), Tense=EMPTY (134; 99%), Voice=EMPTY (133; 99%), Aspect=EMPTY (132; 98%), Person=EMPTY (128; 95%), Gender=EMPTY (119; 88%), VerbForm=Inf (118; 87%), Number=EMPTY (117; 87%).
AUX
tokens may have the following values of Case
:
Acc
(128; 95% of non-emptyCase
): جانے، کرنے، پڑنے، پڑا، کے، جانا، رہنے، پانےAcc,Erg
(1; 1% of non-emptyCase
): جانےNom
(6; 4% of non-emptyCase
): جا، تھا، کی، ہیںEMPTY
(8986): ہے، ہیں، ہوئے، گیا، تھا، ہےں، جا، گئی، گئے، تھی
Paradigm جانا | Acc,Erg | Nom | Acc |
---|---|---|---|
_ | جانے | جا | |
Aspect=Perf|VerbForm=Part | جانے | ||
Gender=Masc|Number=Sing | جا | ||
Gender=Masc|Number=Sing|Person=3 | جانے | ||
Gender=Masc|Number=Sing|VerbForm=Inf | جانے, جانا | ||
Gender=Masc|Number=Plur|VerbForm=Inf | جانے | ||
Gender=Masc|VerbForm=Inf | جانے | ||
Number=Sing|Person=3 | جانے | ||
Number=Plur|VerbForm=Inf | جانے | ||
VerbForm=Inf | جانے |
NUM
94 NUM tokens (4% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (94; 100%).
NUM
tokens may have the following values of Case
:
Acc
(66; 70% of non-emptyCase
): اےک، دونوں، تین، تینوں، کروڑ، ہزار، 30، ایک، لاکھ، چارNom
(28; 30% of non-emptyCase
): دونوں، ایک، لاکھ، 02، 4، 50، آدھ، ارب، اےک، تینEMPTY
(2367): اےک، ایک، دو، تین، دونوں، لاکھ، پانچ، ہزار، چار، کروڑ
Paradigm اےک | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | اےک | |
اےک | اےک |
PART
55 PART tokens (2% of all PART
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PART
and Case
co-occurred: Polarity=EMPTY (55; 100%), PronType=EMPTY (55; 100%).
PART
tokens may have the following values of Case
:
Acc
(18; 33% of non-emptyCase
): بغیر، سالہ، کرام، کے، ہذا، بلا، بھلے، تعالی، حضرت، رفتہNom
(37; 67% of non-emptyCase
): مسٹر، جناب، جیسے، تر، فی، مبارک، مسز، گویا، تعالیٰ، حضراتEMPTY
(2985): بھی، نہیں، مسٹر، ہی، نہ، صرف، جناب، کہ، تو، بغیر
Paradigm حضرت | Nom | Acc |
---|---|---|
Number=Sing | حضرت | |
Number=Sing|Person=3 | حضرت | |
Number=Plur | حضرات |
Case
seems to be lexical feature of PART
. 93% lemmas (25) occur only with one value of Case
.
SCONJ
7 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Case
.
SCONJ
tokens may have the following values of Case
:
Acc
(2; 29% of non-emptyCase
): توNom
(5; 71% of non-emptyCase
): ،، اگر، تب، گویاEMPTY
(2666): کہ، تو، اگر، کیونکہ، تاکہ، بلکہ، حالانکہ، چنانچہ، ,، کیوںکہ
CCONJ
5 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Case
.
CCONJ
tokens may have the following values of Case
:
Acc
(2; 40% of non-emptyCase
): اور، وNom
(3; 60% of non-emptyCase
): و، تاہمEMPTY
(3243): اور، و، لیکن، جبکہ، تاہم، یا، مگر، نیز، لہذا، آیا
X
4 X tokens (29% of all X
tokens) have a non-empty value of Case
.
The most frequent other feature values with which X
and Case
co-occurred: Foreign=EMPTY (4; 100%).
X
tokens may have the following values of Case
:
Acc
(3; 75% of non-emptyCase
): کتنے، افسوسNom
(1; 25% of non-emptyCase
): افسوسEMPTY
(10): ئن، خدارا، را، لوڈ، نئچ، نسبتاً، واقعی، چۓۓپ، ڈان، ہتتپ
Paradigm افسوس | Nom | Acc |
---|---|---|
افسوس | افسوس |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (4460; 74%),
NOUN –[nmod]–> NOUN (3364; 53%),
NOUN –[nmod]–> PROPN (1903; 65%),
NOUN –[det]–> DET (1624; 69%),
NOUN –[conj]–> NOUN (808; 74%),
PROPN –[nmod]–> NOUN (728; 55%),
NOUN –[nmod]–> PRON (718; 58%),
PROPN –[conj]–> PROPN (661; 88%),
PROPN –[nmod]–> PROPN (480; 65%),
NOUN –[det]–> PRON (188; 77%).