Treebank Statistics: UD_Tamil-TTB: Features: Number
This feature is universal.
It occurs with 2 different values: Plur
, Sing
.
5304 tokens (55%) have a non-empty value of Number
.
2512 types (70%) occur at least once with a non-empty value of Number
.
1507 lemmas (74%) occur at least once with a non-empty value of Number
.
The feature is used with 7 part-of-speech tags: NOUN (2753; 29% instances), PROPN (1370; 14% instances), AUX (477; 5% instances), VERB (437; 5% instances), PRON (236; 2% instances), NUM (16; 0% instances), PART (15; 0% instances).
NOUN
2753 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Person=3 (2753; 100%), Gender=Neut (2279; 83%), Case=Nom (1808; 66%).
NOUN
tokens may have the following values of Number
:
Plur
(607; 22% of non-emptyNumber
): நாடுகள், பேர், மக்கள், அதிகாரிகள், புலிகள், போலீஸார், தலைவர்கள், தொழிலாளர்கள், நாட்கள், பணியாளர்கள்Sing
(2146; 78% of non-emptyNumber
): அரசு, தலைவர், செயலாளர், முதல்வர், ஆண்டு, அமைச்சர், கட்சி, தலைமைச், நிலையில், அணுEMPTY
(5): சர்வதேச, நிரந்தர, மத, வகுப்புவாத, விரிவாக்க
Paradigm நாடு | Sing | Plur |
---|---|---|
Case=Acc | நாட்டைச் | நாடுகளைப் |
Case=Dat | நாடுகளுக்க் | |
Case=Gen | நாட்டின் | நாடுகளின் |
Case=Loc | நாட்டில் | நாடுகளில் |
Case=Nom | நாடு | நாடுகள் |
PROPN
1370 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Person=3 (1370; 100%), Polite=EMPTY (1106; 81%), Gender=Neut (1077; 79%), Case=Nom (839; 61%).
PROPN
tokens may have the following values of Number
:
Plur
(33; 2% of non-emptyNumber
): இந்தியர்கள், தமிழர்களுக்க், தமிழர்களை, எமெலேக்களை, எமெலேக்கள், தமிழர்களைச், இடங்களுக்கு, இந்தியர்களை, எமெலேக்களின், எம்.பி.க்கள்Sing
(1337; 98% of non-emptyNumber
): இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, ஒபாமா
Paradigm தமிழர் | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Acc|Gender=Com | தமிழர்களை, தமிழர்களைச் | |
Animacy=Anim|Case=Dat|Gender=Com | தமிழர்களுக்க், தமிழர்களுக்கு, தமிழர்களுக்குத் | |
Animacy=Anim|Case=Nom|Gender=Com | தமிழர்களின் | |
Case=Loc|Gender=Neut | தமிழர்களிடம் | |
Case=Nom|Gender=Neut | தமிழர் |
Number
seems to be lexical feature of PROPN
. 99% lemmas (546) occur only with one value of Number
.
AUX
477 AUX tokens (75% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Polarity=Pos (466; 98%), Person=3 (460; 96%), Mood=Ind (419; 88%), VerbForm=Fin (419; 88%), Voice=Act (401; 84%), Polite=EMPTY (392; 82%), Gender=Neut (351; 74%).
AUX
tokens may have the following values of Number
:
Plur
(122; 26% of non-emptyNumber
): இல்லை, உள்ளனர், உள்ளன, வருகின்றனர், வருகின்றன, உள்ளோம், படுகின்றனர், பட்டனர், இருந்தன, கொண்டனர்Sing
(355; 74% of non-emptyNumber
): உள்ளது, வேண்டும், உள்ளார், பட்டது, இருந்தது, ப்படும், வருகிறது, உள்ளத், படுகிறது, இருந்தார்EMPTY
(157): பட்ட், பட்டு, கொண்டு, ப்பட, செய்து, கொண்ட், செய்த், உள்ள, வந்து, விட்டு
Paradigm உள் | Sing | Plur |
---|---|---|
Animacy=Anim|Gender=Com|Mood=Ind|Person=1|VerbForm=Fin | உள்ளேன் | உள்ளோம் |
Animacy=Anim|Gender=Com|Mood=Ind|Person=3|VerbForm=Fin | உள்ளனர் | |
Case=Acc|Gender=Neut|Person=3|VerbForm=Ger | உள்ளதைய் | |
Case=Ins|Gender=Neut|Person=3|VerbForm=Ger | உள்ளதால் | |
Case=Nom|Gender=Neut|Person=3|VerbForm=Ger | உள்ளத், உள்ளது | |
Gender=Com|Mood=Ind|Person=3|Polite=Form|VerbForm=Fin | உள்ளார் | |
Gender=Neut|Mood=Ind|Person=3|VerbForm=Fin | உள்ளது | உள்ளன |
VERB
437 VERB tokens (35% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Polarity=Pos (435; 100%), Voice=Act (434; 99%), Person=3 (414; 95%), Case=EMPTY (300; 69%), VerbForm=Fin (300; 69%), Mood=Ind (299; 68%), Polite=EMPTY (294; 67%), Gender=Neut (270; 62%), Tense=Past (234; 54%).
VERB
tokens may have the following values of Number
:
Plur
(86; 20% of non-emptyNumber
): தெரிவித்தன, உயிரிழந்தனர், இல்லை, தெரிவித்தனர், காயமடைந்தனர், போராடுவோம், உள்ளன, ஏற்படுகின்றன, கிடைக்காது, சென்றனர்Sing
(351; 80% of non-emptyNumber
): தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, நடைபெறும், இருக்கும், இருந்தார், கூறியத், நடைபெற்றதுEMPTY
(817): தெரிவித்த், செய்து, தெரிவிக்கப், செய்யப், கொண்டு, கலந்து, கூறிய், வழங்கப், வெளியிட்ட், நியமிக்கப்
Paradigm தெரிவி | Sing | Plur |
---|---|---|
Case=Dat|Gender=Neut|Tense=Past|VerbForm=Ger | தெரிவித்ததற்க் | |
Gender=Com|Mood=Ind|Polite=Form|Tense=Past|VerbForm=Fin | தெரிவித்தார் | தெரிவித்தனர் |
Gender=Com|Mood=Ind|Polite=Form|Tense=Pres|VerbForm=Fin | தெரிவிக்கின்றனர் | |
Gender=Neut|Mood=Ind|Tense=Past|VerbForm=Fin | தெரிவித்தது | தெரிவித்தன |
Gender=Neut|Mood=Ind|Tense=Pres|VerbForm=Fin | தெரிவிக்கிறது |
PRON
236 PRON tokens (100% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: PronType=Prs (222; 94%), Person=3 (196; 83%), Gender=Com (171; 72%), Polite=EMPTY (166; 70%), Animacy=EMPTY (135; 57%), Case=Nom (134; 57%).
PRON
tokens may have the following values of Number
:
Plur
(61; 26% of non-emptyNumber
): அனைவரும், அவர்கள், அவர்களை, அவர்களுக்கு, அவர்களது, நாம், தங்கள், நாங்கள், அனைத்தும், நீங்கள்Sing
(175; 74% of non-emptyNumber
): அவர், இது, தனது, அது, அதை, நான், அவரது, இதை, அதில், அவருக்கு
Paradigm அவர் | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Acc | அவர்களை | |
Animacy=Anim|Case=Dat | அவர்களுக்கு | |
Animacy=Anim|Case=Gen | அவர்களது | |
Animacy=Anim|Case=Nom | அவர்கள் | |
Case=Dat|Polite=Form | அவருக்கு, அவருக்குப் | |
Case=Gen|Polite=Form | அவரது | |
Case=Nom|Polite=Form | அவர் |
NUM
16 NUM tokens (6% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumType=Card (16; 100%), NumForm=Digit (9; 56%).
NUM
tokens may have the following values of Number
:
Sing
(16; 100% of non-emptyNumber
): ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்EMPTY
(258): இரு, 2, ஆயிரம், மூன்று, லட்சம், 10, 20, 3, 80, இரண்டு
Number
seems to be lexical feature of NUM
. 100% lemmas (13) occur only with one value of Number
.
PART
15 PART tokens (2% of all PART
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PART
and Number
co-occurred: Polarity=Pos (15; 100%), VerbForm=Ger (15; 100%).
PART
tokens may have the following values of Number
:
Sing
(15; 100% of non-emptyNumber
): என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்EMPTY
(639): உம், ஆன, என்று, ஆக, என, என்ற், ஆகவ், போது, என்ற, தான்
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod]–> PROPN (501; 73%),
NOUN –[nmod]–> NOUN (499; 72%),
PROPN –[nmod]–> PROPN (176; 98%),
PROPN –[nmod]–> NOUN (138; 95%),
NOUN –[conj]–> NOUN (85; 89%),
VERB –[nsubj]–> PROPN (83; 52%),
PROPN –[conj]–> PROPN (82; 100%),
NOUN –[obl]–> NOUN (48; 81%),
NOUN –[nmod]–> PRON (35; 71%),
NOUN –[nsubj]–> PROPN (19; 95%).