Treebank Statistics: UD_Urdu-UDTB: POS Tags: NUM
There are 333 NUM
lemmas (3%), 325 NUM
types (3%) and 2461 NUM
tokens (2%).
Out of 16 observed tags, the rank of NUM
is: 5 in number of lemmas, 5 in number of types and 13 in number of tokens.
The 10 most frequent NUM
lemmas: اےک، ایک، دو، تین، لاکھ، ہزار، چھ، چار، کروڑ، پانچ
The 10 most frequent NUM
types: اےک، ایک، دو، تین، دونوں، لاکھ، ہزار، کروڑ، پانچ، چار
The 10 most frequent ambiguous lemmas: اےک (NUM 530, PRON 9, NOUN 2, PART 1), ایک (NUM 256, NOUN 5, PROPN 3, ADJ 1, ADV 1, PRON 1), دو (NUM 198, NOUN 20, ADJ 16, DET 3, PROPN 2, PRON 1), تین (NUM 79, ADJ 2, NOUN 2), لاکھ (NUM 53, NOUN 3), ہزار (NUM 53, NOUN 12, ADJ 2, PROPN 1), چار (NUM 45, NOUN 1), کروڑ (NUM 44, NOUN 5, ADJ 1), پانچ (NUM 42, ADJ 1), دس (NUM 34, ADJ 1, NOUN 1, PROPN 1)
The 10 most frequent ambiguous types: اےک (NUM 535, PRON 8, NOUN 3, PART 1), ایک (NUM 281, NOUN 5, PROPN 3, ADV 1, PRON 1), دو (NUM 139, PROPN 2, NOUN 1), دونوں (NUM 70, NOUN 22, ADJ 13, DET 3, PRON 1), لاکھ (NUM 48, NOUN 2), ہزار (NUM 47, NOUN 9, PROPN 1), کروڑ (NUM 45, NOUN 4), پانچ (NUM 44, ADJ 1), چار (NUM 44, NOUN 1), دس (NUM 34, NOUN 1, PROPN 1)
- اےک
- NUM 535: اس عہدے کے لئے کئی اےک دعویدار تھے ۔
- PRON 8: ہم اےک دوسرے کے حلیف اور شراکت_دار ہیں ۔
- NOUN 3: اس قانون کے نفاذ سے کئی اےک اوقافی جائیدادیں وقف زمرے سے باہر ہےں ‘ فی_الوقت یہ قانون پارلیمنٹ سیلکٹ کمیٹی سے رجوع کیا گیا ہے ۔
- PART 1: مسٹر لکشمی نارائن ڈسٹرکٹ ایڈیشنل میڈیکل اینڈ ہیلتھ آفیسر نے کہا کہ ایڈس اےک جان لیوا مہلک مرض ہے ۔
- ایک
- NUM 281: اب اس علاقہ میں صرف ایک منڈی ہے جہاں 400 لائسنس_یافتہ تاجران چرم ہیں ۔
- NOUN 5: درحقیقت کل کی جھڑپ دونوں سکھ گروؤں میں سے ایک کی مذہبی تقریر پر تنازعہ کا نتیجہ ہے ۔
- PROPN 3: خاتون زمرہ میں ممکن ہے کہ عالمی نمبر ایک دینارا سفینا کا کوارٹر فائنل میں دفاعی چیمپین اینا ایوانووچ سے مقابلہ ہو ۔
- ADV 1: آر جے ڈی سربراہ اور ایس پی سربراہ یعنی لالو پرساد یادو اور ملائم سنگھ یادو کو ایوان کے پہلے اجلاس کے موقع پر ایک ساتھ بیٹھا ہوا دیکھا گیا ۔
- PRON 1: جیسے ہی وہ حلف لینے مائک کے قریب پہنچے ، وہاں بیٹھے ہوئے دیگر قائدین بشمول لالو پرساد نے ٹیکم سنجائے کے عجیب و غریب عمامہ کے بارے میں ایک دوسرے سے استفسار کرنا شروع کر دیا ۔
- دو
- NUM 139: جن مےں دو کی حالت تشویشناک بتائی جاتی ہے ۔
- PROPN 2: بی جے پی کارکنوں کی ہلڑ بازی اور کمشنر کے گھیراؤ کے خلاف بطور احتجاج آفس اسٹاف نے قلم روک دو ہڑتال کی اور اپنے فرائض انجام نہیں دیے ۔
- NOUN 1: گرفتار کیے گئے چار ملزمین مےں دو کا اڑیسہ , مغربی بنگال اور بہار سے اےک اےک ملزم کا تعلق بتایا گیا ہے ۔
- دونوں
- NUM 70: ان دونوں مقدمات مےں عدالتوں نے گجرات حکومت کے خلاف شکنجہ کس دیا ہے ۔
- NOUN 22: چنانچہ دونوں کو حیدرآباد روانہ کیا گیا ۔
- ADJ 13: ان تعلقات کے نتیجہ میں دونوں ملکوں کے مابین دیرپا شراکت کو یقینی بنایا جا سکے ۔
- DET 3: رائے شماری کے دن دونوں قائدین نے اول تا آخری راؤنڈ تک نتیجہ کو تذبذب میں رکھا -
- PRON 1: آئی سی پی ایل کے جنرل سکریٹری جنہیں آج برطرف کر دیا گیا بتایا کہ ایر انڈیا اور انڈین ایر لائینس کے انضمام سے قبل دونوں کا خسارہ علی_الترتیب 455 کروڑ اور 280 کروڑ روپئے تھا جو اندرون تین سال بڑھ کر 16000 کروڑ روپئے تک پہنچ گیا ہے حالانکہ کمپنی نے 90 کروڑ روپئے صرف کرتے ہوئے کنسلٹینسی فرم ڈیلوئیٹ کی خدمات حاصل کی ہیں ۔
- لاکھ
- ہزار
- کروڑ
- پانچ
- چار
- دس
- NUM 34: ملبہ سے دس نعشیں نکالی گئی ہےں ۔
- NOUN 1: ای ایس آئی دواخانے جہاں ملازمین کی تعداد کم از کم دس ہو وہاں پر بھی اب ای ایس آئی اسکیمات کا احاطہ ہوگا ۔
- PROPN 1: اڈیشنل سالیسیٹر جنرل مسٹر موہن پراسرن نے عدالت کو مطلع کیا کہ وہ آئندہ مہینے کی دس تاریخ تک اس سلسلہ مےں حکومت کی جانب سے کئے جانے والے اقدامات سے عدالت کو واقف کروائیں_گے ۔
Morphology
The form / lemma ratio of NUM
is 0.975976 (the average of all parts of speech is 1.103404).
The 1st highest number of forms (6) was observed with the lemma “چھ”: 2, 3, 4, 5, 6, چھ.
The 2nd highest number of forms (3) was observed with the lemma “ایک”: 15, 2.4, ایک.
The 3rd highest number of forms (2) was observed with the lemma “1”: 1, 124361.
NUM
occurs with 6 features: NumType (2461; 100% instances), Case (94; 4% instances), Number (59; 2% instances), Gender (45; 2% instances), Person (25; 1% instances), Echo (6; 0% instances)
NUM
occurs with 9 feature-value pairs: Case=Acc
, Case=Nom
, Echo=Rdp
, Gender=Fem
, Gender=Masc
, NumType=Card
, Number=Plur
, Number=Sing
, Person=3
NUM
occurs with 19 feature combinations.
The most frequent feature combination is NumType=Card
(2353 tokens).
Examples: اےک، ایک، دو، تین، دونوں، لاکھ، ہزار، پانچ، کروڑ، چار
Relations
NUM
nodes are attached to their parents using 15 different relations: nummod (2126; 86% instances), compound (139; 6% instances), obl (46; 2% instances), nmod (36; 1% instances), dep (29; 1% instances), nsubj (21; 1% instances), conj (17; 1% instances), obj (16; 1% instances), amod (8; 0% instances), root (7; 0% instances), xcomp (7; 0% instances), acl:relcl (5; 0% instances), acl (2; 0% instances), dislocated (1; 0% instances), iobj (1; 0% instances)
Parents of NUM
nodes belong to 8 different parts of speech: NOUN (2001; 81% instances), NUM (242; 10% instances), PROPN (92; 4% instances), VERB (79; 3% instances), ADJ (29; 1% instances), PRON (7; 0% instances), (7; 0% instances), DET (4; 0% instances)
1987 (81%) NUM
nodes are leaves.
329 (13%) NUM
nodes have one child.
94 (4%) NUM
nodes have two children.
51 (2%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 9.
Children of NUM
nodes are attached using 19 different relations: dep (147; 21% instances), compound (132; 19% instances), case (114; 16% instances), punct (65; 9% instances), nummod (57; 8% instances), nmod (53; 7% instances), amod (26; 4% instances), conj (22; 3% instances), cop (20; 3% instances), nsubj (20; 3% instances), cc (17; 2% instances), obl (12; 2% instances), det (8; 1% instances), mark (4; 1% instances), obj (4; 1% instances), acl:relcl (3; 0% instances), advcl (1; 0% instances), advmod (1; 0% instances), iobj (1; 0% instances)
Children of NUM
nodes belong to 14 different parts of speech: NUM (242; 34% instances), PART (129; 18% instances), ADP (122; 17% instances), PUNCT (65; 9% instances), NOUN (53; 7% instances), AUX (20; 3% instances), CCONJ (17; 2% instances), PROPN (15; 2% instances), DET (11; 2% instances), ADJ (10; 1% instances), ADV (8; 1% instances), PRON (7; 1% instances), SCONJ (4; 1% instances), VERB (4; 1% instances)