Treebank Statistics: UD_Urdu-UDTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
74073 tokens (54%) have a non-empty value of Gender
.
8867 types (82%) occur at least once with a non-empty value of Gender
.
7852 lemmas (82%) occur at least once with a non-empty value of Gender
.
The feature is used with 14 part-of-speech tags: NOUN (32504; 24% instances), PROPN (16889; 12% instances), ADP (10419; 8% instances), VERB (7550; 5% instances), AUX (3999; 3% instances), ADJ (1441; 1% instances), PRON (614; 0% instances), ADV (441; 0% instances), DET (115; 0% instances), PART (47; 0% instances), NUM (45; 0% instances), CCONJ (6; 0% instances), X (2; 0% instances), SCONJ (1; 0% instances).
NOUN
32504 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (32398; 100%), Number=Sing (27377; 84%), Case=Acc (17103; 53%).
NOUN
tokens may have the following values of Gender
:
Fem
(6073; 19% of non-emptyGender
): حکومت، پولیس، بات، پارٹی، کارروائی، کمیٹی، ریاست، ٹیم، کوشش، ہدایتMasc
(26431; 81% of non-emptyGender
): حاصل، آج، عوام، ضلع، اجلاس، افراد، سال، طور، طرح، ارکانEMPTY
(465): اللہ، علیہ، مرکزی، صلی، مرحوم، وسلم، انتخابی، رضی، نقصان، دونوں
Paradigm حکومت | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | حکومت | حکومت |
Case=Acc|Number=Plur | حکومتوں | حکومتوں, حکومتیں |
Case=Nom|Number=Sing | حکومت | حکومت |
Case=Nom|Number=Plur | حکومتیں | حکومتیں |
PROPN
16889 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Person=3 (16879; 100%), Number=Sing (16829; 100%), Case=Nom (9869; 58%).
PROPN
tokens may have the following values of Gender
:
Fem
(654; 4% of non-emptyGender
): پارٹی، مسجد، دہلی، کانگریس، اردو، سونیا، سبھا، کمیٹی، حکومت، ریاستMasc
(16235; 96% of non-emptyGender
): پی، سی، آئی، ایس، کانگریس، بی، ہندوستان، اے، ٹی، ریڈیEMPTY
(246): ریڈی، سنگھ، گاندھی، کرت، ریاستی، صدیقی، نائیڈو، برائے، سبھروال، و
Paradigm پی | Masc | Fem |
---|---|---|
Case=Acc | پی | پی |
Case=Nom | پی, بی | پی |
Gender
seems to be lexical feature of PROPN
. 96% lemmas (3558) occur only with one value of Gender
.
ADP
10419 ADP tokens (37% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: Number=Sing (10069; 97%), AdpType=Post (9908; 95%), Case=Nom (5615; 54%).
ADP
tokens may have the following values of Gender
:
Fem
(3739; 36% of non-emptyGender
): کی، وجہ، جانب، حیثیت، والی، مدد، طرف، غرض، کو، کےMasc
(6680; 64% of non-emptyGender
): کے، کا، بعد، جانب، ساتھ، دوران، قبل، ذریعہ، پاس، زیرEMPTY
(17387): نے، سے، کے، مےں، کو، پر، میں، لیے، تک، خلاف
Paradigm کا | Masc | Fem |
---|---|---|
AdpType=Post | کے | |
AdpType=Post|Case=Acc | کی | |
AdpType=Post|Case=Acc|Number=Sing | کے, کا, کی, سے, نے | کی, کے, والی, کا |
AdpType=Post|Case=Acc|Number=Sing|Person=3 | کا, کے | |
AdpType=Post|Case=Acc|Number=Sing|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Acc|Number=Plur | کے | کی |
AdpType=Post|Case=Acc|Number=Plur|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Nom|Number=Sing | کا, کے, کی | کی, کا, کو, کے |
AdpType=Post|Case=Nom|Number=Sing|Person=3 | کی | |
AdpType=Post|Case=Nom|Number=Sing|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Nom|Number=Plur | کے | کی |
AdpType=Post|Case=Nom|Number=Plur|Person=3 | کے | |
AdpType=Post|Case=Nom|Number=Plur|Person=3|Polite=Form | کے | |
AdpType=Post|Number=Sing | کا | کی |
AdpType=Post|Number=Sing|Person=3 | کا | |
Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part | کی | |
Case=Acc | کے | |
Case=Acc|Number=Sing | کے | |
Case=Acc|Number=Plur | کے | |
Case=Nom|Number=Sing | کے | کی |
VERB
7550 VERB tokens (59% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Case=EMPTY (7440; 99%), Person=EMPTY (6616; 88%), VerbForm=Part (6484; 86%), Number=Sing (6409; 85%), Aspect=Perf (5388; 71%), Voice=Act (4884; 65%).
VERB
tokens may have the following values of Gender
:
Fem
(1872; 25% of non-emptyGender
): کی، دی، ہوئی، ہوگی، ہوتی، بتائی، لی، چکی، رہی، آئیMasc
(5678; 75% of non-emptyGender
): کیا، کہا، دیا، کرتے، بتایا، لیا، ہوا، کیے، ہوگا، کرناEMPTY
(5145): کر، ہو، کرنے، ہے، ہونے، کریں، دینے، ہوئے، دے، رکھنے
Paradigm کرنا | Masc | Fem |
---|---|---|
Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کرتے | کرتیں |
Aspect=Imp|Number=Sing|VerbForm=Part | کرتے, کرتا | کرتی, کرتے |
Aspect=Imp|Number=Sing|VerbForm=Part|Voice=Act | کرتا, کرتے | کرتی |
Aspect=Imp|Number=Plur|VerbForm=Part | کرتے | |
Aspect=Imp|Number=Plur|VerbForm=Part|Voice=Act | کرتے | کرتیں |
Aspect=Perf|Case=Acc|Number=Sing|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Case=Acc|Number=Sing|VerbForm=Part | کئے, کیے | کی |
Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کئے | |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | کئے, کیا, کیے | |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Act | کیا, کئے, کر, کی | کی |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Pass | کئے, کیے | کی |
Aspect=Perf|Number=Sing|VerbForm=Part | کیا, کئے, کرتے, کیے | کی, کیے |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Act | کیا, کیے, کئے, کر, کی | کی, کریں |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Pass | کیا, کئے, کیے | کی |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Act | کئے, کیے, کیں | کیں |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Pass | کیے | |
Aspect=Perf|Number=Plur|VerbForm=Part | کیے, کئے | |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Act | کیے, کئے, کریں | کیں |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Pass | کیے, کئے | |
Aspect=Perf|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|VerbForm=Part|Voice=Act | کیے | |
Case=Acc|Number=Sing|Person=3|Voice=Pass | کی | |
Case=Acc|Number=Plur|VerbForm=Inf | کرنے | |
Case=Acc|VerbForm=Inf | کرنے | |
Case=Nom|Number=Sing|VerbForm=Inf | کرنا | |
Case=Nom|Number=Sing|Voice=Act | کی | |
Case=Nom|Number=Plur|Person=3|Voice=Act | کر | |
Case=Nom|VerbForm=Inf | کرنے | |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریںگے | |
Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریگا, کرےگا | کرےگی, کریں_گی, کریگی |
Mood=Ind|Number=Sing|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے | کرےگی, کریں_گی |
Mood=Ind|Number=Plur|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کرینگے | |
Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
Mood=Ind|Number=Plur|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
Mood=Sub|Number=Sing|Person=3|Polite=Form|VerbForm=Fin|Voice=Act | کریں_گے, کریں | |
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | کریں, کرے | |
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | کریں | |
Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Pass | کریں | |
Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Pass | کریں | کریں |
Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Pass | کریں | |
Number=Sing|Person=3 | کیے, کر | |
Number=Sing|Person=3|VerbForm=Inf|Voice=Pass | کرنی | |
Number=Sing|Person=3|Voice=Act | کرےگا, کیا, کر, کریں_گے | کرےگی, کی |
Number=Sing|VerbForm=Inf | کرنا | |
Number=Sing|VerbForm=Inf|Voice=Act | کرنا, کرنے | کرنی |
Number=Sing|VerbForm=Inf|Voice=Pass | کرنا | کرنی |
Number=Sing|Voice=Act | کیا, کر, کرےگا, کہا | کریں, کی |
Number=Sing|Voice=Pass | کیا | کی |
Number=Plur|VerbForm=Inf | کرنے | |
Number=Plur|VerbForm=Inf|Voice=Act | کرنے | کرنی |
Number=Plur|VerbForm=Inf|Voice=Pass | کرنے | |
VerbForm=Inf | کرنے |
AUX
3999 AUX tokens (44% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=EMPTY (3739; 93%), Number=Sing (2943; 74%), Person=EMPTY (2650; 66%), Tense=EMPTY (2450; 61%), Mood=EMPTY (2394; 60%), VerbForm=Part (2282; 57%).
AUX
tokens may have the following values of Gender
:
Fem
(1105; 28% of non-emptyGender
): گئی، تھی، رہی، گی، سکتی، جاتی، جائےگی، تھیں، ہوئی، گئیںMasc
(2894; 72% of non-emptyGender
): گیا، تھا، تھے، گئے، ہیں، رہے، رہا، سکتا، جائےگا، گےEMPTY
(5122): ہے، ہوئے، ہےں، ہیں، جا، کر، جائے، جانے، چاہیے، ہوں
Paradigm ہے | Masc | Fem |
---|---|---|
Aspect=Perf|Number=Sing|VerbForm=Part | ہوا, ہے | ہے |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin | ہیں | ہیں |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | ہے, ہیں | ہیں |
Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں, ہے | ہیں |
Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin | ہیں, ہے | ہیں |
Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | |
Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | ہوں_گے | |
Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin | ہیں, ہےں | ہیں |
Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
Mood=Ind|Number=Plur|Tense=Pres|VerbForm=Fin | ہیں, ہے | ہیں |
Mood=Ind|Number=Plur|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
ADJ
1441 ADJ tokens (14% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (926; 64%).
ADJ
tokens may have the following values of Gender
:
Fem
(475; 33% of non-emptyGender
): والی، دوسری، بڑی، پہلی، پوری، نئی، آخری، خصوصی، اچھی، سیاسیMasc
(966; 67% of non-emptyGender
): والے، بڑے، والا، دوسرے، والوں، نئے، پہلے، پہلا، دوسرا، بڑاEMPTY
(9074): جاری، شامل، دیگر، سابق، موجود، پیدا، ہلاک، منعقد، ریاستی، سرکاری
Paradigm والا | Masc | Fem |
---|---|---|
_ | والی | |
Case=Acc | والی | |
Case=Acc|Number=Sing | والے, والا | والی |
Case=Acc|Number=Sing|Person=3 | والا | |
Case=Acc|Number=Plur | والے, والوں | |
Case=Nom | والی | |
Case=Nom|Number=Sing | والا, والے | والی |
Case=Nom|Number=Sing|Person=3 | والا | |
Case=Nom|Number=Plur | والے | |
Number=Sing | والا | والی |
Number=Sing|Person=3 | والا, والے | والی |
Number=Plur | والے | والی |
PRON
614 PRON tokens (11% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (562; 92%), Number=Sing (406; 66%), Polite=EMPTY (403; 66%), Case=Acc (308; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(139; 23% of non-emptyGender
): اپنی، ہماری، میری، انہیں، تمہاری، اتنی، اسی، ان، اُس، ایسیMasc
(475; 77% of non-emptyGender
): انہوں، انہیں، اپنے، ایسا، ہمارے، ایسے، اُنھوں، انھیں، اپنا، دوسرےEMPTY
(4983): اس، وہ، ان، انہوں، جو، جس، یہ، اپنے، کوئی، کسی
Paradigm وہ | Masc | Fem |
---|---|---|
Case=Acc,Dat|Number=Sing|Polite=Form|PronType=Prs | انہیں, انہوں, انھیں, انھوں, اُنھیں | انہیں |
Case=Acc,Dat|Number=Sing|PronType=Prs | انھیں | |
Case=Acc,Dat|Number=Plur|PronType=Prs | انھیں, انہیں | |
Case=Acc|Number=Sing | اُس | اُس |
Case=Acc|Number=Sing|Polite=Form | اُن, انہوں | |
Case=Acc|Number=Sing|Polite=Form|PronType=Prs | انہوں, اُنھوں, انھوں, ان | |
Case=Acc|Number=Sing|PronType=Prs | اُس, انہوں, اُن | |
Case=Acc|Number=Plur | اُن | |
Case=Acc|Number=Plur|Polite=Form|PronType=Prs | انہوں | |
Case=Acc|Number=Plur|PronType=Prs | انہوں | ان |
Case=Nom|Number=Sing|Polite=Form|PronType=Prs | انھوں, اُنھیں | |
Case=Nom|Number=Plur|PronType=Prs | انہیں | |
Number=Sing|Polite=Form|PronType=Prs | انہوں |
ADV
441 ADV tokens (32% of all ADV
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADV
and Gender
co-occurred: AdvType=EMPTY (440; 100%), Number=Sing (437; 99%), Person=3 (408; 93%), Case=Nom (398; 90%), AdpType=Post (372; 84%).
ADV
tokens may have the following values of Gender
:
Fem
(5; 1% of non-emptyGender
): بڑی، جانب، آس، کافیMasc
(436; 99% of non-emptyGender
): پیش، بعد، پہلے، دوران، جانب، طرف، آگے، باہر، سامنے، قبلEMPTY
(945): پھر، بہت، سے، مزید، پیش، دوبارہ، جلد، انتہائی، ہمیشہ، ہنوز
Paradigm جانب | Masc | Fem |
---|---|---|
AdpType=Post|Case=Acc | جانب | |
AdpType=Post|Case=Nom | جانب, عنقریب | جانب |
Case=Acc | جانب |
Gender
seems to be lexical feature of ADV
. 98% lemmas (53) occur only with one value of Gender
.
DET
115 DET tokens (5% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (102; 89%), Person=EMPTY (96; 83%), PronType=Dem (91; 79%), Case=Nom (68; 59%).
DET
tokens may have the following values of Gender
:
Fem
(18; 16% of non-emptyGender
): ایسی، اسی، انہیں، بڑی، تھوڑی، جتنی، ساریMasc
(97; 84% of non-emptyGender
): ایسے، ایسا، یہ، اتنا، اسی، سارے، پورے، ایسی، دوسرے، کیاEMPTY
(2381): اس، یہ، ان، کئی، تمام، کچھ، اسی، ہر، چند، کوئی
Paradigm یہ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | اسی | اسی |
Case=Acc|Number=Plur | ایسی | |
Case=Nom|Number=Sing|Person=3 | یہ, اسی | |
Case=Nom|Number=Sing | اس, اسی | اسی |
Case=Nom|Number=Plur | ایسی | |
Number=Sing|Person=3 | یہ |
PART
47 PART tokens (2% of all PART
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PART
and Gender
co-occurred: Polarity=EMPTY (47; 100%), PronType=EMPTY (47; 100%).
PART
tokens may have the following values of Gender
:
Fem
(2; 4% of non-emptyGender
): مسٹر، ویںMasc
(45; 96% of non-emptyGender
): مسٹر، کرام، جناب، حضرت، مسز، کے، بلا، بھلے، تعالی، تعالیٰEMPTY
(2993): بھی، نہیں، مسٹر، ہی، نہ، صرف، جناب، کہ، تو، بغیر
Paradigm مسٹر | Masc | Fem |
---|---|---|
Case=Nom | مسٹر | مسٹر |
مسٹر |
Gender
seems to be lexical feature of PART
. 95% lemmas (19) occur only with one value of Gender
.
NUM
45 NUM tokens (2% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (45; 100%).
NUM
tokens may have the following values of Gender
:
Fem
(3; 7% of non-emptyGender
): تینوں، دوسری، پہلیMasc
(42; 93% of non-emptyGender
): دونوں، کروڑ، ایک، ہزار، 30، اےک، لاکھ، 02، 101، 29EMPTY
(2416): اےک، ایک، دو، تین، دونوں، لاکھ، چار، ہزار، پانچ، کروڑ
Paradigm تین | Masc | Fem |
---|---|---|
تینوں | تینوں |
Gender
seems to be lexical feature of NUM
. 96% lemmas (22) occur only with one value of Gender
.
CCONJ
6 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Gender
.
CCONJ
tokens may have the following values of Gender
:
Fem
(1; 17% of non-emptyGender
): وMasc
(5; 83% of non-emptyGender
): و، آیا، اور، تاہمEMPTY
(3242): اور، و، لیکن، جبکہ، تاہم، یا، مگر، نیز، لہذا، آیا
X
2 X tokens (14% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Foreign=EMPTY (2; 100%), Number=Sing (2; 100%), Person=3 (2; 100%).
X
tokens may have the following values of Gender
:
Masc
(2; 100% of non-emptyGender
): افسوسEMPTY
(12): کتنے، ئن، خدارا، را، لوڈ، نئچ، نسبتاً، واقعی، چۓۓپ، ڈان
SCONJ
1 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Gender
.
SCONJ
tokens may have the following values of Gender
:
Masc
(1; 100% of non-emptyGender
): ،EMPTY
(2672): کہ، تو، اگر، کیونکہ، تاکہ، بلکہ، حالانکہ، چنانچہ، ,، کیوںکہ
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
PROPN –[compound]–> PROPN (7500; 92%),
NOUN –[nmod]–> NOUN (4376; 69%),
NOUN –[nmod]–> PROPN (2271; 77%),
NOUN –[compound]–> NOUN (1863; 81%),
PROPN –[nmod]–> NOUN (1175; 88%),
VERB –[nsubj]–> PROPN (932; 55%),
NOUN –[conj]–> NOUN (837; 76%),
PROPN –[conj]–> PROPN (690; 93%),
PROPN –[nmod]–> PROPN (650; 89%),
PROPN –[compound]–> NOUN (414; 93%).