Treebank Statistics: UD_Tamil-TTB: Features: Gender
This feature is universal.
It occurs with 3 different values: Com
, Masc
, Neut
.
5261 tokens (55%) have a non-empty value of Gender
.
2483 types (69%) occur at least once with a non-empty value of Gender
.
1495 lemmas (74%) occur at least once with a non-empty value of Gender
.
The feature is used with 5 part-of-speech tags: NOUN (2753; 29% instances), PROPN (1370; 14% instances), AUX (477; 5% instances), VERB (425; 4% instances), PRON (236; 2% instances).
NOUN
2753 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (2753; 100%), Number=Sing (2146; 78%), Case=Nom (1808; 66%).
NOUN
tokens may have the following values of Gender
:
Com
(472; 17% of non-emptyGender
): தலைவர், செயலாளர், முதல்வர், பேர், மக்கள், அதிகாரிகள், அமைச்சர், அதிபர், உறுப்பினர், புலிகள்Masc
(2; 0% of non-emptyGender
): அற்றவன், ஆடவனின்Neut
(2279; 83% of non-emptyGender
): அரசு, நாடுகள், ஆண்டு, கட்சி, தலைமைச், நிலையில், அணு, அறிக்கையில், அரசின், பகுதியில்EMPTY
(5): சர்வதேச, நிரந்தர, மத, வகுப்புவாத, விரிவாக்க
Paradigm மக்கள் | Neut | Com |
---|---|---|
Animacy=Anim|Case=Acc|Number=Plur | மக்களை, மக்களைக் | |
Animacy=Anim|Case=Dat|Number=Plur | மக்களுக்கு | |
Animacy=Anim|Case=Gen|Number=Plur | மக்களின் | |
Animacy=Anim|Case=Loc|Number=Plur | மக்களிடம் | |
Animacy=Anim|Case=Nom|Number=Plur | மக்கள் | |
Case=Dat|Number=Sing | மக்களுக்க் | |
Case=Dat|Number=Sing|Polite=Form | மக்களுக்குப் |
Gender
seems to be lexical feature of NOUN
. 98% lemmas (818) occur only with one value of Gender
.
PROPN
1370 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Person=3 (1370; 100%), Number=Sing (1337; 98%), Polite=EMPTY (1106; 81%), Case=Nom (839; 61%).
PROPN
tokens may have the following values of Gender
:
Com
(293; 21% of non-emptyGender
): ஒபாமா, ஜெயலலிதா, சிங், எடியூரப்பா, கருணாநிதி, மோடி, வைகோ, ஒபாமாவின், மாலதி, இந்தியர்கள்Neut
(1077; 79% of non-emptyGender
): இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, சர்வதேச
Paradigm தமிழர் | Neut | Com |
---|---|---|
Animacy=Anim|Case=Acc|Number=Plur | தமிழர்களை, தமிழர்களைச் | |
Animacy=Anim|Case=Dat|Number=Plur | தமிழர்களுக்க், தமிழர்களுக்கு, தமிழர்களுக்குத் | |
Animacy=Anim|Case=Nom|Number=Plur | தமிழர்களின் | |
Case=Loc|Number=Plur | தமிழர்களிடம் | |
Case=Nom|Number=Sing | தமிழர் |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (547) occur only with one value of Gender
.
AUX
477 AUX tokens (75% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Polarity=Pos (466; 98%), Person=3 (460; 96%), Mood=Ind (419; 88%), VerbForm=Fin (419; 88%), Voice=Act (401; 84%), Polite=EMPTY (392; 82%), Number=Sing (355; 74%).
AUX
tokens may have the following values of Gender
:
Com
(126; 26% of non-emptyGender
): உள்ளார், உள்ளனர், வருகின்றனர், இருந்தார், உள்ளோம், கொண்டார், படுகின்றனர், பட்டனர், இருக்கிறார், உள்ளேன்Neut
(351; 74% of non-emptyGender
): உள்ளது, வேண்டும், இல்லை, பட்டது, உள்ளன, இருந்தது, ப்படும், வருகிறது, உள்ளத், படுகிறதுEMPTY
(157): பட்ட், பட்டு, கொண்டு, ப்பட, செய்து, கொண்ட், செய்த், உள்ள, வந்து, விட்டு
Paradigm உள் | Neut | Com |
---|---|---|
Animacy=Anim|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin | உள்ளேன் | |
Animacy=Anim|Mood=Ind|Number=Plur|Person=1|VerbForm=Fin | உள்ளோம் | |
Animacy=Anim|Mood=Ind|Number=Plur|Person=3|VerbForm=Fin | உள்ளனர் | |
Case=Acc|Number=Sing|Person=3|VerbForm=Ger | உள்ளதைய் | |
Case=Ins|Number=Sing|Person=3|VerbForm=Ger | உள்ளதால் | |
Case=Nom|Number=Sing|Person=3|VerbForm=Ger | உள்ளத், உள்ளது | |
Mood=Ind|Number=Sing|Person=3|Polite=Form|VerbForm=Fin | உள்ளார் | |
Mood=Ind|Number=Sing|Person=3|VerbForm=Fin | உள்ளது | |
Mood=Ind|Number=Plur|Person=3|VerbForm=Fin | உள்ளன |
VERB
425 VERB tokens (34% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Polarity=Pos (423; 100%), Voice=Act (422; 99%), Person=3 (414; 97%), Number=Sing (351; 83%), Case=EMPTY (288; 68%), VerbForm=Fin (288; 68%), Mood=Ind (287; 68%), Polite=EMPTY (282; 66%), Tense=Past (232; 55%).
VERB
tokens may have the following values of Gender
:
Com
(155; 36% of non-emptyGender
): தெரிவித்தார், என்றார், கூறினார், உயிரிழந்தனர், இருந்தார், தெரிவித்தனர், காயமடைந்தனர், பார்வையிட்டார், பெற்றார், பேசினார்Neut
(270; 64% of non-emptyGender
): உள்ளது, தெரிகிறது, தெரிவித்தன, நடைபெறும், இருக்கும், இல்லை, கூறியத், நடைபெற்றது, உயிரிழந்தத், உயிரிழப்பத்EMPTY
(829): தெரிவித்த், செய்து, தெரிவிக்கப், செய்யப், கொண்டு, கலந்து, கூறிய், வழங்கப், வெளியிட்ட், நியமிக்கப்
Paradigm தெரிவி | Neut | Com |
---|---|---|
Case=Dat|Number=Sing|Tense=Past|VerbForm=Ger | தெரிவித்ததற்க் | |
Mood=Ind|Number=Sing|Polite=Form|Tense=Past|VerbForm=Fin | தெரிவித்தார் | |
Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin | தெரிவித்தது | |
Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin | தெரிவிக்கிறது | |
Mood=Ind|Number=Plur|Polite=Form|Tense=Past|VerbForm=Fin | தெரிவித்தனர் | |
Mood=Ind|Number=Plur|Polite=Form|Tense=Pres|VerbForm=Fin | தெரிவிக்கின்றனர் | |
Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin | தெரிவித்தன |
PRON
236 PRON tokens (100% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (222; 94%), Person=3 (196; 83%), Number=Sing (175; 74%), Polite=EMPTY (166; 70%), Animacy=EMPTY (135; 57%), Case=Nom (134; 57%).
PRON
tokens may have the following values of Gender
:
Com
(171; 72% of non-emptyGender
): அவர், அனைவரும், அவர்கள், தனது, நான், அவரது, அவர்களை, அவர்களுக்கு, அவருக்கு, அவர்களதுNeut
(65; 28% of non-emptyGender
): இது, அது, அதை, இதை, அதில், இதன், அதற்க், அனைத்தும், எதுவும், அதனைத்
Gender
seems to be lexical feature of PRON
. 100% lemmas (25) occur only with one value of Gender
.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[nmod]–> NOUN (485; 70%),
NOUN –[nmod]–> PROPN (470; 68%),
PROPN –[nmod]–> NOUN (114; 79%),
NOUN –[conj]–> NOUN (89; 93%),
PROPN –[conj]–> PROPN (77; 94%),
NOUN –[obl]–> NOUN (51; 86%),
PROPN –[conj]–> NOUN (15; 79%),
NOUN –[nsubj]–> NOUN (14; 52%),
NOUN –[nsubj]–> PROPN (14; 70%),
PRON –[nmod]–> NOUN (8; 100%).