Treebank Statistics: UD_Persian-Seraji: POS Tags: PRON
There are 54 PRON
lemmas (0%), 77 PRON
types (0%) and 5807 PRON
tokens (4%).
Out of 15 observed tags, the rank of PRON
is: 9 in number of lemmas, 9 in number of types and 7 in number of tokens.
The 10 most frequent PRON
lemmas: آن، او، خود، این، من، ما، وی، تو، همه، شما
The 10 most frequent PRON
types: خود، آن، او، این، ما، ش، من، آنها، وی، همه
The 10 most frequent ambiguous lemmas: آن (PRON 1094, DET 370, NOUN 3), این (DET 2403, PRON 583, CCONJ 1), من (PRON 484, X 8, ADJ 1, SCONJ 1), ما (PRON 461, X 2), وی (PRON 280, NOUN 4), تو (PRON 224, ADP 3), همه (PRON 207, DET 24), شما (PRON 155, NOUN 1), بعضی (PRON 65, DET 19), هم (SCONJ 461, CCONJ 61, PRON 61)
The 10 most frequent ambiguous types: آن (PRON 592, DET 366, NOUN 3), این (DET 2370, PRON 489, CCONJ 1), ما (PRON 403, X 2), من (PRON 339, X 8), آنها (PRON 289, DET 1), وی (PRON 280, NOUN 4), همه (PRON 192, DET 4), تو (PRON 159, ADP 3), شان (PRON 145, NOUN 1), م (PRON 143, VERB 20, ADJ 1, SCONJ 1)
- آن
- PRON 592: اگر این بحرانسازی کار یک اقلیت کوچک است چرا اکثریت در مقابل آن ساکت ند ؟
- DET 366: هرگاه او را یاد میکنم ، بر آن محبت و دوستی افزوده میشود .
- NOUN 3: فیلم “ تنها با زمین “ پیش از این نشان ویژه جشنواره فیلمهای کوتاه شهر گراتس اتریش را از آن خود کرد و در بخش مسابقه جشنواره فیلمهای کوتاه آسپن در ایالت کلورادو آمریکا به نمایش در آمد .
- این
- ما
- من
- آنها
- PRON 289: آنها هم از تو نیستند .
- DET 1: مجمع حزبالله مجلس در بیانیه خود گفته است : در آستانه تشکیل مجلس ششم و آغاز دورهای جدید از تحرک و پویایی در کشور ، متأسفانه شاهد کشمکشهای شکننده و تضییعکننده نهادهای مدنی بودهایم که نتیجه آن ، اتلاف سرمایههای ملی و مهمترین آنها ، نشاط و شادابی ملت ایران بوده است .
- وی
- همه
- تو
- شان
- PRON 145: جد شان آیتالله شیخ هادی نجمآبادی از عالمان بزرگ دوره ناصری بود .
- NOUN 1: چهارم ، از همه قبیحتر ، چانه زدن مجری مراسم با شرکتکنندگان در مراسم قرعهکشی خودروی اهدایی بود که شان رسانهای آموزشی - فرهنگی را که میتواند مدرسهای فراگیر باشد ، تا حد یک بقالی ) یا حداکثر ، یک نمایشگاه اتومبیل ( پایین آورد .
- م
- PRON 143: گفت : تمام محبت او در دل م باقی است .
- VERB 20: تا زنده ام و مسلمان م بیعت تو را نقض خواهم کرد .
- ADJ 1: علاوه بر آن ما ، اگر قرار باشد چیزی بشنویم ، اینجا آمدهایم که حرفهای پیرمرد آقا محمد فیاضی مقنی ۴۹ ساله یزدی را بشنویم که هشتاد و پنج سال آن را توی قنات گذرانده و شصت و پنج سال پیش یعنی آن روزها که من هنوز هشت نه ساله بودم ۱۳۱۴ شمسی / ۱۹۳۵ م شش سال قبل از جنگ بینالملل دوم ، از یزد راه افتاده و به کهنوج و ایرانشهر رفته و همان روزگار چهار تا قنات در آن ولایت بیابانی درآورده است .
- SCONJ 1: دستافشان چو نهالان همه سو در خم و خیز ، محرم م با قدحِ آینهکردار نکرد .
Morphology
The form / lemma ratio of PRON
is 1.425926 (the average of all parts of speech is 1.409222).
The 1st highest number of forms (8) was observed with the lemma “آن”: آن, آنان, آنها, آنها, آنهایی, اش, دان, ش.
The 2nd highest number of forms (6) was observed with the lemma “این”: این, اینان, اینها, ین, ینها, ینها.
The 3rd highest number of forms (4) was observed with the lemma “_”: آنانی, بعضیهای, بعضیها, همانها.
PRON
occurs with 4 features: PronType (5800; 100% instances), Number (5251; 90% instances), Person (3622; 62% instances), Reflex (796; 14% instances)
PRON
occurs with 14 feature-value pairs: Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Neg
, PronType=Prs
, PronType=Rcp
, PronType=Rel
, PronType=Tot
, Reflex=Yes
PRON
occurs with 20 feature combinations.
The most frequent feature combination is Number=Sing|Person=3|PronType=Prs
(1297 tokens).
Examples: او، ش، وی، اش، خویش، و، خوی
Relations
PRON
nodes are attached to their parents using 22 different relations: nmod:poss (2569; 44% instances), nsubj (1320; 23% instances), obl (612; 11% instances), nmod (407; 7% instances), obj (340; 6% instances), det (150; 3% instances), fixed (119; 2% instances), root (85; 1% instances), conj (65; 1% instances), ccomp (31; 1% instances), dislocated (26; 0% instances), nsubj:nc (22; 0% instances), compound:lvc (17; 0% instances), xcomp (10; 0% instances), dep (9; 0% instances), det:predet (7; 0% instances), mark (6; 0% instances), appos (5; 0% instances), nsubj:pass (3; 0% instances), flat (2; 0% instances), advcl (1; 0% instances), parataxis (1; 0% instances)
Parents of PRON
nodes belong to 12 different parts of speech: NOUN (2911; 50% instances), VERB (2053; 35% instances), ADJ (346; 6% instances), PRON (217; 4% instances), ADV (103; 2% instances), (85; 1% instances), ADP (54; 1% instances), CCONJ (20; 0% instances), NUM (11; 0% instances), SCONJ (4; 0% instances), AUX (2; 0% instances), INTJ (1; 0% instances)
3819 (66%) PRON
nodes are leaves.
1557 (27%) PRON
nodes have one child.
262 (5%) PRON
nodes have two children.
169 (3%) PRON
nodes have three or more children.
The highest child degree of a PRON
node is 7.
Children of PRON
nodes are attached using 27 different relations: case (1364; 50% instances), punct (214; 8% instances), nmod:poss (201; 7% instances), nmod (178; 6% instances), acl:relcl (128; 5% instances), ccomp (122; 4% instances), cop (121; 4% instances), nsubj (118; 4% instances), conj (70; 3% instances), cc (63; 2% instances), fixed (51; 2% instances), det (36; 1% instances), advmod (27; 1% instances), appos (11; 0% instances), mark (11; 0% instances), amod (8; 0% instances), advcl (6; 0% instances), dep (4; 0% instances), flat (4; 0% instances), obl (4; 0% instances), aux (3; 0% instances), compound (2; 0% instances), nummod (2; 0% instances), xcomp (2; 0% instances), cc:preconj (1; 0% instances), dislocated (1; 0% instances), vocative (1; 0% instances)
Children of PRON
nodes belong to 13 different parts of speech: ADP (1026; 37% instances), NOUN (406; 15% instances), PART (327; 12% instances), PRON (217; 8% instances), PUNCT (214; 8% instances), VERB (197; 7% instances), AUX (124; 5% instances), CCONJ (107; 4% instances), ADJ (47; 2% instances), ADV (40; 1% instances), DET (24; 1% instances), SCONJ (13; 0% instances), NUM (11; 0% instances)