Treebank Statistics: UD_Tamil-MWTT: Features: Gender
This feature is universal.
It occurs with 4 different values: Com
, Fem
, Masc
, Neut
.
615 tokens (24%) have a non-empty value of Gender
.
266 types (32%) occur at least once with a non-empty value of Gender
.
125 lemmas (28%) occur at least once with a non-empty value of Gender
.
The feature is used with 5 part-of-speech tags: VERB (351; 14% instances), PRON (153; 6% instances), AUX (71; 3% instances), NOUN (38; 1% instances), PROPN (2; 0% instances).
VERB
351 VERB tokens (69% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (324; 92%), Mood=EMPTY (309; 88%), Polarity=EMPTY (309; 88%), VerbForm=EMPTY (309; 88%), Number=Sing (299; 85%), Tense=Past (211; 60%).
VERB
tokens may have the following values of Gender
:
Com
(81; 23% of non-emptyGender
): கொடுத்தார், வந்தார்கள், வேண்டும், பிடிக்கும், வருவார்கள், எழுதினேன், பாடுகிறார்கள், போனேன், போவோம், வாங்கினேன்Fem
(3; 1% of non-emptyGender
): இருக்கிறாள், பாடினாள், வெறுக்கிறாள்Masc
(185; 53% of non-emptyGender
): வந்தான், இருக்கிறான், சாப்பிட்டான், உட்கார்ந்தான், பேசினான், கேட்டான், போனான், வாங்கினான், இருந்தான், கொடுத்தான்Neut
(82; 23% of non-emptyGender
): இருக்கிறது, வரவில்லை, வந்தது, வந்தன, இருக்கின்றன, ஓடுகிறது, திறந்தது, தொங்குகிறது, நேர்ந்தது, அரித்ததுEMPTY
(161): வந்து, வர, வா, உண்டு, படித்து, போய், வேண்டாம், அடிக்கப், உட்கார்ந்து, எடுக்க
Paradigm இரு | Masc | Fem | Neut | Com |
---|---|---|---|---|
Mood=Ind|Number=Plur|Person=3|Polarity=Pos|Polite=Form|Tense=Pres|VerbForm=Fin|Voice=Act | இருக்கின்றன | |||
Number=Sing|Person=1|Tense=Pres | இருக்கிறேன் | |||
Number=Sing|Person=3|Tense=Fut | இருப்பான் | |||
Number=Sing|Person=3|Tense=Past | இருந்தான் | இருந்தது | ||
Number=Sing|Person=3|Tense=Pres | இருக்கிறான் | இருக்கிறாள் | இருக்கிறது | |
Number=Plur|Person=3|Tense=Pres | இருக்கின்றன | இருக்கிறார்கள் |
PRON
153 PRON tokens (89% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (127; 83%), Animacy=EMPTY (117; 76%), PronType=EMPTY (108; 71%), Case=Nom (86; 56%).
PRON
tokens may have the following values of Gender
:
Com
(98; 64% of non-emptyGender
): நான், தன், தன்னை, நீ, என், எங்கள், என்னை, நீங்கள், அவர்கள், நாங்கள்Fem
(2; 1% of non-emptyGender
): அவள், இவள்Masc
(35; 23% of non-emptyGender
): அவன், அவனுக்கு, இவன், அவனிடம், அவனுடைய, அவளை, அவள், எவன், அவனாக, அவளுக்குNeut
(18; 12% of non-emptyGender
): அது, இது, இதை, இதைப், அதுக்கு, அவைகள், இதைத், இவைகள், எதுவும்EMPTY
(18): எல்லோரும், என்ன, ஒவ்வொருவருக்கும், எது, சிலவற்றை, சிலவற்றைப், பலவற்றை
Paradigm அவள் | Masc | Fem |
---|---|---|
Case=Acc | அவளை | |
Case=Dat | அவளுக்கு | |
Case=Nom | அவள் | அவள் |
Gender
seems to be lexical feature of PRON
. 95% lemmas (19) occur only with one value of Gender
.
AUX
71 AUX tokens (83% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbForm=EMPTY (69; 97%), Person=3 (68; 96%), Polarity=EMPTY (67; 94%), Number=Sing (64; 90%).
AUX
tokens may have the following values of Gender
:
Com
(28; 39% of non-emptyGender
): வேண்டும், இருக்கிறார்கள், முடியும், வந்தார்கள், வரும், இருக்கிறார், இருக்கும், இருப்பார்கள், கூடும், போகும்Masc
(35; 49% of non-emptyGender
): இருக்கிறான், விட்டான், வைத்தான், இருந்தான், இருப்பான், கொண்டான், பட்டான், மாட்டான், உள்ளேன், படுகிறான்Neut
(8; 11% of non-emptyGender
): ஆயிற்று, முடிந்தது, இருக்கிறது, படுகிறது, போகிறது, வேண்டியதுEMPTY
(15): கொண்டு, கூடாது, மாட்டேன், ஆகாது, கொடுக்க, கொண்டே, விட்டு, வேண்டி
Paradigm இரு | Masc | Neut | Com |
---|---|---|---|
Number=Sing|Polite=Form|Tense=Pres | இருக்கிறார் | ||
Number=Sing|Tense=Fut | இருப்பான் | இருக்கும் | |
Number=Sing|Tense=Past | இருந்தான் | ||
Number=Sing|Tense=Pres | இருக்கிறான் | இருக்கிறது | |
Number=Plur|Tense=Fut | இருப்பார்கள் | ||
Number=Plur|Tense=Pres | இருக்கிறார்கள் |
NOUN
38 NOUN tokens (7% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (38; 100%), Number=Sing (33; 87%), Case=Nom (20; 53%).
NOUN
tokens may have the following values of Gender
:
Com
(1; 3% of non-emptyGender
): மாணவர்கள்Masc
(12; 32% of non-emptyGender
): அப்பாவிடம், அப்பாவுக்கு, மாணவன், தலைவன், பையனைப், பையன், பையன்கள், மாப்பிள்ளையைத், வேலைக்காரன்Neut
(25; 66% of non-emptyGender
): கடிதம், கதவைத், நாய்கள், இட்லி, இட்லியைச், உடம்புக்கு, ஊருக்குப், கதவு, சாவி, சாவியால்EMPTY
(496): வீடு, பரிசு, குழந்தைக்கு, மந்திரி, வீட்டுக்கு, பையன், பணம், புத்தகம், பெண், மணிக்கு
Gender
seems to be lexical feature of NOUN
. 100% lemmas (22) occur only with one value of Gender
.
PROPN
2 PROPN tokens (1% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (2; 100%), Person=3 (2; 100%), Polite=EMPTY (2; 100%).
PROPN
tokens may have the following values of Gender
:
Neut
(2; 100% of non-emptyGender
): சென்னைக்கு, பாண்டிச்சேரிEMPTY
(313): குமார், குமாருக்கு, குமாரை, ராஜா, ராஜாவை, குமாருக்குத், குமாருக்குப், ராஜாவுக்கு, அமெரிகாவுக்கு, குமாருக்குச்
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[nsubj]–> PRON (37; 53%),
PRON –[nsubj]–> PRON (6; 100%),
VERB –[obl]–> PRON (3; 75%),
VERB –[nsubj:nc]–> PRON (2; 67%),
VERB –[xcomp]–> NOUN (2; 100%),
PRON –[nmod]–> PRON (1; 100%),
PROPN –[obl]–> PROPN (1; 100%).