Treebank Statistics: UD_Hindi-HDTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
185891 tokens (53%) have a non-empty value of Gender
.
15289 types (80%) occur at least once with a non-empty value of Gender
.
12477 lemmas (80%) occur at least once with a non-empty value of Gender
.
The feature is used with 14 part-of-speech tags: NOUN (77241; 22% instances), PROPN (37639; 11% instances), ADP (26218; 7% instances), VERB (23926; 7% instances), AUX (11065; 3% instances), ADJ (4376; 1% instances), PRON (3516; 1% instances), ADV (1387; 0% instances), DET (464; 0% instances), PART (35; 0% instances), NUM (16; 0% instances), X (5; 0% instances), SCONJ (2; 0% instances), PUNCT (1; 0% instances).
NOUN
77241 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (77214; 100%), Number=Sing (62647; 81%), Case=Acc (41556; 54%).
NOUN
tokens may have the following values of Gender
:
Fem
(27489; 36% of non-emptyGender
): सरकार, पुलिस, पार्टी, बात, तरह, बैठक, सुरक्षा, जानकारी, बातचीत, रिपोर्टMasc
(49752; 64% of non-emptyGender
): लोगों, मामले, राज्य, चुनाव, देश, समय, साल, शुरू, रुपये, दिनEMPTY
(914): हवाई, दोनों, मुख्य, खुफिया, अध्यक्ष, संयुक्त, चीफ, जनरल, उप, ऑफ
Paradigm सरकार | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | सरकार | |
Case=Acc|Number=Sing|Person=3 | सरकार | सरकार |
Case=Acc|Number=Plur|Person=3 | सरकारों | सरकारों |
Case=Nom|Number=Sing|Person=3 | सरकार | |
Case=Nom|Number=Plur|Person=3 | सरकारें, सरकार |
Gender
seems to be lexical feature of NOUN
. 95% lemmas (5986) occur only with one value of Gender
.
PROPN
37639 PROPN tokens (88% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Person=3 (37556; 100%), Number=Sing (37407; 99%), Case=Nom (19783; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(6617; 18% of non-emptyGender
): कांग्रेस, दिल्ली, भाजपा, सरकार, सोनिया, मुंबई, उमा, माकपा, पार्टी, जनताMasc
(31022; 82% of non-emptyGender
): भारत, सिंह, प्रधानमंत्री, पाकिस्तान, मंत्री, कश्मीर, केंद्र, प्रदेश, मंत्रालय, मनमोहनEMPTY
(5301): सिंह, गांधी, आडवाणी, भारतीय, केंद्रीय, राष्ट्रीय, यादव, ऑफ, वाजपेयी, पासवान
Paradigm प्रधानमंत्री | Masc | Fem |
---|---|---|
Case=Acc | प्रधानमंत्री | |
Case=Nom | प्रधानमंत्री | प्रधानमंत्री |
प्रधानमंत्री |
Gender
seems to be lexical feature of PROPN
. 95% lemmas (6476) occur only with one value of Gender
.
ADP
26218 ADP tokens (36% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: AdpType=Post (25275; 96%), Number=Sing (21248; 81%).
ADP
tokens may have the following values of Gender
:
Fem
(8698; 33% of non-emptyGender
): की, ओर, वजह, तरह, जैसी, तरफ, तुलना, जगह, अपेक्षा, केMasc
(17520; 67% of non-emptyGender
): के, का, साथ, बाद, दौरान, बीच, कारण, पहले, पास, रूपEMPTY
(46997): में, को, के, ने, से, पर, लिए, तक, द्वारा, बारे
Paradigm का | Masc | Fem |
---|---|---|
AdpType=Post | की | |
AdpType=Post|Case=Acc | के | की |
AdpType=Post|Case=Acc,Gen|Number=Sing|Poss=Yes | का, के | की |
AdpType=Post|Case=Acc,Gen|Number=Plur|Poss=Yes | के | की |
AdpType=Post|Case=Acc|Number=Sing | के, का, की | की, के, का |
AdpType=Post|Case=Acc|Number=Sing|Person=3 | के | की |
AdpType=Post|Case=Acc|Number=Sing|Person=3|Polite=Form | के | |
AdpType=Post|Case=Acc|Number=Plur | के, का | की, के |
AdpType=Post|Case=Acc|Number=Plur|Person=3 | के | की |
AdpType=Post|Case=Nom | की | |
AdpType=Post|Case=Nom|Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Past|VerbForm=Fin | के | |
AdpType=Post|Case=Nom|Number=Sing | का, के, की | की, के |
AdpType=Post|Case=Nom|Number=Sing|Person=2|Polite=Form | के | |
AdpType=Post|Case=Nom|Number=Sing|Person=3 | का, की | की |
AdpType=Post|Case=Nom|Number=Sing|Person=3|Polite=Form | के | |
AdpType=Post|Case=Nom|Number=Plur | के, का | की |
AdpType=Post|Case=Nom|Number=Plur|Person=3 | के | |
AdpType=Post|Number=Sing | के | की |
AdpType=Post|Number=Plur|Person=3 | के | |
Case=Acc|Number=Sing | के | की |
Case=Acc|Number=Plur | के | |
Case=Nom|Number=Sing | का | की |
Case=Nom|Number=Sing|Person=3|Polite=Form | के |
Gender
seems to be lexical feature of ADP
. 92% lemmas (87) occur only with one value of Gender
.
VERB
23926 VERB tokens (67% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Case=EMPTY (23683; 99%), Number=Sing (19973; 83%), VerbForm=Part (17986; 75%), Voice=Act (16932; 71%), Aspect=Perf (15579; 65%), Person=EMPTY (12793; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(6442; 27% of non-emptyGender
): की, दी, हुई, कर, हो, होगी, ली, मिली, आई, जताईMasc
(17484; 73% of non-emptyGender
): कहा, किया, दिया, बताया, कर, करते, लिया, हो, किए, हुआEMPTY
(12033): करने, है, कर, हो, होने, देने, लेकर, कहना, बनाने, लेने
Paradigm करना | Masc | Fem |
---|---|---|
_ | कर | |
Aspect=Imp|Case=Acc|Number=Sing|VerbForm=Part | करते | |
Aspect=Imp|Echo=Rdp|Number=Sing|VerbForm=Part | करते | |
Aspect=Imp|Number=Sing|Person=1|VerbForm=Part|Voice=Act | करता | |
Aspect=Imp|Number=Sing|Person=2|Polite=Form|VerbForm=Part|Voice=Act | करते | |
Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part | करते | |
Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | करते | करती |
Aspect=Imp|Number=Sing|Person=3|VerbForm=Part | करते | |
Aspect=Imp|Number=Sing|Person=3|VerbForm=Part|Voice=Act | करता, करते, करवाता | करती |
Aspect=Imp|Number=Sing|VerbForm=Part | करते, करता | करती |
Aspect=Imp|Number=Sing|VerbForm=Part|Voice=Act | करता, करते | करती |
Aspect=Imp|Number=Plur|Person=1|VerbForm=Part|Voice=Act | करते | |
Aspect=Imp|Number=Plur|Person=3|VerbForm=Part|Voice=Act | करते | करती |
Aspect=Imp|Number=Plur|VerbForm=Part | करते | करती |
Aspect=Imp|Number=Plur|VerbForm=Part|Voice=Act | करते | करती, करतीं |
Aspect=Perf|Number=Sing|Person=1|VerbForm=Part|Voice=Act | की | |
Aspect=Perf|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | किए, करा, किये | |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | किए, किये | किए, की |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Act | किया, करा, करवाया, किए, कर | की, करा, कर |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Pass | किया, करवाया, करा, कराया | की |
Aspect=Perf|Number=Sing|VerbForm=Part | किए, किया, किये | की |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Act | किया, करवाया, करा, किये | की |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Pass | किया, करा, करवाया | की |
Aspect=Perf|Number=Plur|Person=3|Polite=Form|VerbForm=Part|Voice=Act | किए | |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | किए | की |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Act | किए, करा, किये, किया | की, कीं |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Pass | किए, किये | की |
Aspect=Perf|Number=Plur|VerbForm=Part | किए | की |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Act | किए, किये, करा | की, कीं |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Pass | किए, किये | की |
Aspect=Perf|VerbForm=Part | किया, किए | की |
Aspect=Perf|VerbForm=Part|Voice=Act | किया, किए | की |
Aspect=Perf|VerbForm=Part|Voice=Pass | किया, किए | की |
Case=Acc|Number=Sing|Person=3|Polite=Form|VerbForm=Inf|Voice=Act | करने | |
Case=Acc|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करने | करने |
Case=Acc|Number=Sing|VerbForm=Inf | करने | |
Case=Acc|VerbForm=Inf | करने | करने |
Case=Acc|VerbForm=Inf|Voice=Act | करने | |
Case=Nom|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना | |
Case=Nom|Number=Sing|Person=3|Voice=Act | कर | |
Case=Nom|Number=Sing|Voice=Act | कर | |
Mood=Ind|Number=Sing|Person=1|Tense=Fut|VerbForm=Fin|Voice=Act | करूंगा, करूँगा | करुंगी, करूँगी |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे | करेंगी |
Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | करेगा | करेगी, करूंगी |
Mood=Ind|Number=Plur|Person=1|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे, करेगें | |
Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin | करेंगे | |
Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे, करवाएंगे | करेंगी |
Mood=Ind|Number=Plur|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे | |
Number=Sing|Person=1|Voice=Act | कर | |
Number=Sing|Person=2|Polite=Form|Voice=Act | कर, करवा | |
Number=Sing|Person=3 | कर | |
Number=Sing|Person=3|Polite=Form|VerbForm=Inf|Voice=Act | करने | |
Number=Sing|Person=3|Polite=Form|Voice=Act | कर | कर |
Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना, करने, कराना | करनी, करने |
Number=Sing|Person=3|VerbForm=Inf|Voice=Pass | करनी | |
Number=Sing|Person=3|Voice=Act | कर | कर, की |
Number=Sing|Person=3|Voice=Pass | कर | कर |
Number=Sing|VerbForm=Inf | करना | |
Number=Sing|VerbForm=Inf|Voice=Act | करना, करने | करनी, करने |
Number=Sing|VerbForm=Inf|Voice=Pass | करनी | |
Number=Sing|Voice=Act | कर | कर |
Number=Sing|Voice=Pass | कर | कर |
Number=Plur|Person=1|Voice=Act | कर | |
Number=Plur|Person=3|VerbForm=Inf|Voice=Act | करने | करनी |
Number=Plur|Person=3|Voice=Act | कर | कर |
Number=Plur|Person=3|Voice=Pass | कर | कर |
Number=Plur|VerbForm=Inf|Voice=Act | करने | |
Number=Plur|Voice=Act | कर | कर |
Number=Plur|Voice=Pass | कर | कर |
VerbForm=Inf|Voice=Act | करना, करने | करनी |
VerbForm=Inf|Voice=Pass | करने | |
Voice=Act | कर | कर |
AUX
11065 AUX tokens (47% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=EMPTY (10564; 95%), Number=Sing (8947; 81%), Person=EMPTY (8905; 80%), Tense=EMPTY (7642; 69%), Mood=EMPTY (7591; 69%), VerbForm=Part (7436; 67%), Aspect=Perf (6351; 57%).
AUX
tokens may have the following values of Gender
:
Fem
(3108; 28% of non-emptyGender
): गई, थी, रही, जाएगी, सकती, थीं, जाती, हुई, गयी, पड़ीMasc
(7957; 72% of non-emptyGender
): गया, था, गए, हुए, रहे, थे, रहा, जाएगा, सकता, जाताEMPTY
(12691): है, हैं, जा, जाने, चाहिए, जाए, कर, सके, रहे, हूं
Paradigm है | Masc | Fem |
---|---|---|
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | हैं | |
Case=Nom|Number=Sing | है | |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin | हैं | |
Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | है | है |
Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin | हैं | |
Number=Sing | है | |
Number=Plur | हैं | |
Number=Plur|Person=3 | हों, हैं | |
Number=Plur|Person=3|Voice=Act | हों |
ADJ
4376 ADJ tokens (20% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (3430; 78%), Case=Acc (2378; 54%).
ADJ
tokens may have the following values of Gender
:
Fem
(1419; 32% of non-emptyGender
): वाली, पूरी, नई, पहली, बड़ी, दूसरी, अच्छी, कड़ी, लंबी, पुरानीMasc
(2957; 68% of non-emptyGender
): वाले, पिछले, पूरा, अगले, नए, पूरे, दूसरे, बड़े, वाला, बड़ाEMPTY
(17269): शामिल, अन्य, जारी, पूर्व, भारतीय, तैयार, स्थित, वरिष्ठ, पेश, दर्ज
Paradigm वाला | Masc | Fem |
---|---|---|
Case=Acc | वाले | |
Case=Acc|Number=Sing | वाले, वाला | वाली |
Case=Acc|Number=Sing|Person=3 | वाला, वाले | |
Case=Acc|Number=Sing|Person=3|Polite=Form | वाले | |
Case=Acc|Number=Plur | वाले, वालों | वाली |
Case=Acc|Number=Plur|Person=3 | वाले, वालों | |
Case=Nom|Number=Sing | वाला, वाले | वाली |
Case=Nom|Number=Sing|Person=3 | वाला | वाली |
Case=Nom|Number=Sing|Person=3|Polite=Form | वाले | |
Case=Nom|Number=Plur | वाले | वाली |
Number=Sing | वाला | वाली |
Number=Sing|Person=3 | वाला, वाले | वाली |
Number=Sing|Person=3|Polite=Form | वाले | वाली |
Number=Plur | वाले | |
Number=Plur|Person=3 | वाले | वाली |
PRON
3516 PRON tokens (24% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (3505; 100%), Polite=EMPTY (2826; 80%), Case=Acc,Gen (2038; 58%), Poss=Yes (2038; 58%), Number=Sing (2026; 58%), Person=3 (2010; 57%).
PRON
tokens may have the following values of Gender
:
Fem
(1142; 32% of non-emptyGender
): अपनी, उनकी, इसकी, उसकी, हमारी, इनकी, जिसकी, मेरी, आपकी, जिनकीMasc
(2374; 68% of non-emptyGender
): अपने, उनके, इसके, अपना, इसका, उनका, उसके, ऐसा, उसका, ऐसेEMPTY
(11186): उन्होंने, यह, वह, कोई, उन्हें, इसके, अब, किसी, वे, इससे
Paradigm वह | Masc | Fem |
---|---|---|
Case=Acc,Dat|Number=Sing|Person=3|Polite=Form | उन्हें | उनकी |
Case=Acc,Erg|Number=Sing|Person=3|Polite=Form | उन्होंने | उन्होंने |
Case=Acc,Erg|Number=Sing|Person=3 | उन्होंने, उसने | उसने |
Case=Acc,Erg|Number=Plur|Person=3 | उन्होंने | |
Case=Acc,Gen|Number=Sing|Person=3|Polite=Form|Poss=Yes | उनके, उनका, उनकी | उनकी |
Case=Acc,Gen|Number=Sing|Person=3|Poss=Yes | उसके, उसका, उनका, उनके | उसकी, उनकी |
Case=Acc,Gen|Number=Plur|Person=3|Polite=Form|Poss=Yes | उनके | |
Case=Acc,Gen|Number=Plur|Person=3|Poss=Yes | उनके, उनका, उसके, उनकी | उनकी |
Case=Acc,Gen|Person=3|Polite=Form|Poss=Yes | उनकी | |
Case=Acc,Gen|Poss=Yes | उनकी | |
Case=Acc,Ins|Number=Sing|Person=3|Polite=Form | उनसे | |
Case=Acc,Ins|Number=Plur | उनके | |
Case=Acc|Number=Sing|Person=3|Polite=Form | उन | |
Case=Acc|Number=Sing|Person=3 | उसी | |
Case=Nom|Number=Sing|Person=3|Polite=Form | वे | |
Case=Nom|Number=Sing|Person=3 | वही | वह |
Case=Nom|Number=Plur|Person=3 | वे |
ADV
1387 ADV tokens (42% of all ADV
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADV
and Gender
co-occurred: AdvType=EMPTY (1384; 100%), Number=Sing (1381; 100%), AdpType=Post (1372; 99%), Person=3 (1370; 99%), Case=Nom (1137; 82%).
ADV
tokens may have the following values of Gender
:
Fem
(55; 4% of non-emptyGender
): ओर, तरफ, इतनी, थोड़ी, सीधी, खासी, तरफ़, दूर, पहल, पासMasc
(1332; 96% of non-emptyGender
): बाद, पहले, आगे, साथ, दौरान, सामने, दूर, बीच, बाहर, पीछेEMPTY
(1920): सबसे, फिर, वहीं, जल्द, लगातार, फिलहाल, बहुत, जमकर, दोबारा, बार
Paradigm दूर | Masc | Fem |
---|---|---|
Case=Acc | दूर | |
Case=Nom | दूर | दूर |
DET
464 DET tokens (6% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Person=EMPTY (364; 78%), Number=Sing (295; 64%), PronType=Dem (270; 58%), Case=Nom (252; 54%).
DET
tokens may have the following values of Gender
:
Fem
(148; 32% of non-emptyGender
): ऐसी, सारी, इतनी, थोड़ी, कितनी, उतनी, आधी, इसी, उसी, जितनीMasc
(316; 68% of non-emptyGender
): ऐसे, ऐसा, आधा, इतना, इतने, सारे, सारा, आधे, कितने, इसEMPTY
(7061): इस, यह, इन, कुछ, कई, सभी, कम, ज्यादा, काफी, उस
Paradigm यह | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Person=3 | इस, इसी, यही | इसी, ऐसी |
Case=Acc|Number=Sing | इसी | |
Case=Acc|Number=Plur|Person=3 | इन्हीं | इन्हीं |
Case=Nom|Number=Sing|Person=3 | यही, यह | इसी, यह |
PART
35 PART tokens (0% of all PART
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PART
and Gender
co-occurred: Polarity=EMPTY (35; 100%), PronType=EMPTY (35; 100%).
PART
tokens may have the following values of Gender
:
Fem
(14; 40% of non-emptyGender
): सीMasc
(21; 60% of non-emptyGender
): सा, गुना, से, भी, जैसेEMPTY
(6974): भी, नहीं, ही, न, तो, करीब, से, भर, लगभग, सिर्फ
Paradigm सा | Masc | Fem |
---|---|---|
Case=Acc | सी | |
Case=Acc|Number=Sing | सी | |
Case=Nom | सी | |
Case=Nom|Number=Sing | सा | सी |
Case=Nom|Number=Plur | से | सी |
Number=Sing | सा | सी |
Number=Plur | से | सी |
NUM
16 NUM tokens (0% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (16; 100%).
NUM
tokens may have the following values of Gender
:
Masc
(16; 100% of non-emptyGender
): दोनों, पौने, आधा, आधे, दर्जनों, दूसरे, पौन, ७००EMPTY
(6724): एक, दो, दोनों, तीन, करोड़, चार, लाख, हजार, पांच, छह
X
5 X tokens (4% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Foreign=EMPTY (5; 100%).
X
tokens may have the following values of Gender
:
Masc
(5; 100% of non-emptyGender
): अपने, आधा, दर्जन, बडे, साथEMPTY
(135): पास, रिकॉर्ड, डाउनलोड, फिट, फेल, बुक, अलग, आउट, आफ, इंटरसेप्ट
SCONJ
2 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Gender
.
SCONJ
tokens may have the following values of Gender
:
Masc
(2; 100% of non-emptyGender
): जैसाEMPTY
(6724): कि, तो, हालांकि, अगर, यदि, क्योंकि, ताकि, बहरहाल, बल्कि, यानि
PUNCT
1 PUNCT tokens (0% of all PUNCT
tokens) have a non-empty value of Gender
.
PUNCT
tokens may have the following values of Gender
:
Fem
(1; 100% of non-emptyGender
): (EMPTY
(23454): ।, ,, -, ., ‘, ), (, -JOIN, ?, ‘1
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
PROPN –[compound]–> PROPN (8069; 54%),
NOUN –[nmod]–> NOUN (6841; 51%),
VERB –[nsubj]–> NOUN (5125; 61%),
VERB –[compound]–> NOUN (5012; 59%),
NOUN –[nmod]–> PROPN (4558; 55%),
NOUN –[compound]–> NOUN (3607; 52%),
VERB –[nsubj]–> PROPN (2920; 53%),
NOUN –[nmod]–> PRON (2707; 78%),
PROPN –[nmod]–> NOUN (1621; 59%),
PROPN –[nmod]–> PROPN (1614; 69%).