Treebank Statistics: UD_Arabic-PUD: POS Tags: PRON
There are 16 PRON
lemmas (0%), 36 PRON
types (1%) and 1299 PRON
tokens (6%).
Out of 16 observed tags, the rank of PRON
is: 10 in number of lemmas, 8 in number of types and 7 in number of tokens.
The 10 most frequent PRON
lemmas: هُوَ، الَّذِي، هذا، ذ
لِكَ، ما، مِن، أُولائِكَ، ماذا، من، آخَر
The 10 most frequent PRON
types: ه، ها، التي، هم، ذلك، هذا، الذي، ما، هذه، هو
The 10 most frequent ambiguous lemmas: ذ`لِكَ (PRON 85, ADV 1, NOUN 1), ما (PRON 48, ADP 9, PART 1, PROPN 1), مِن (ADP 545, PRON 7), أُولائِكَ (PRON 6, NOUN 1), آخَر (ADJ 27, DET 4, NOUN 3, PRON 1), أَحَد (DET 33, PROPN 2, NOUN 1, PRON 1), شِبه (DET 4, PRON 1, PROPN 1), غالِبِيَّة (DET 2, NOUN 1, PRON 1), م (NOUN 5, ADJ 1, PRON 1)
The 10 most frequent ambiguous types: ه (PRON 308, NOUN 1), ذلك (PRON 70, NOUN 1), ما (PRON 48, PART 36, ADP 2), ك (ADP 40, PRON 13), من (ADP 533, PRON 11), أولئك (PRON 6, NOUN 1), آخر (ADJ 9, DET 9, NOUN 1, PRON 1), أحد (DET 19, NOUN 1, PRON 1), شبه (DET 4, PRON 1, PROPN 1), م (NOUN 5, ADP 4, ADJ 1, PRON 1)
- ه
- ذلك
- ما
- ك
- من
- أولئك
- آخر
- أحد
- شبه
- DET 4: استبعدت الرقابة كل الآراء غير المرغوب ب ها , و باتت المشاركة في الحياة العامة شبه مستحيلة .
- PRON 1: في الحرب الميسينية الثانية , برهنت إسبارطة على أن ها قوة إقليمية في شبه جزيرة بيلوبونيز و في سائر أراضي اليونان .
- PROPN 1: خلال القرن الثالث عشر , استخدم بعض الكتاب اسم بوليا ل لدلالة على الجزء الجنوبي من شبه الجزيرة الإيطالية .
- م
- NOUN 5: قد يكون أشهر إنسانٍ من العصر النحاسي هو المومياء المتجمدة أوتزي , الذي عاش عام 3300 ق . م تقريباً .
- ADP 4: فوز دونالد ترامب س يثير قلق العالم مباشرة و يجعل ه أكثر اضطراباً م ما هو علي ه الآن .
- ADJ 1: في عام 833 م , أصبحت هذه دولة مورافيا العظمى بعد فتح إمارة نيترا ( سلوفاكيا المعاصرة ) .
- PRON 1: لا أدري ل م اخترت ها …
Morphology
The form / lemma ratio of PRON
is 2.250000 (the average of all parts of speech is 1.381137).
The 1st highest number of forms (14) was observed with the lemma “هُوَ”: أنا, ك, كم, نا, نحن, ني, ه, ها, هم, هما, هن, هو, هي, ي.
The 2nd highest number of forms (5) was observed with the lemma “الَّذِي”: التي, الذي, الذين, اللذان, اللذين.
The 3rd highest number of forms (5) was observed with the lemma “ه`ذا”: هؤلاء, هذا, هذان, هذه, هذين.
PRON
occurs with 4 features: Case (1252; 96% instances), Number (1226; 94% instances), Gender (1145; 88% instances), Person (826; 64% instances)
PRON
occurs with 11 feature-value pairs: Case=Acc
, Case=Gen
, Case=Nom
, Gender=Fem
, Gender=Masc
, Number=Dual
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
PRON
occurs with 44 feature combinations.
The most frequent feature combination is Case=Gen|Gender=Masc|Number=Sing|Person=3
(219 tokens).
Examples: ه
Relations
PRON
nodes are attached to their parents using 16 different relations: nmod (425; 33% instances), nsubj (294; 23% instances), obj (158; 12% instances), obl (149; 11% instances), det (119; 9% instances), dep (82; 6% instances), nsubj:pass (29; 2% instances), conj (15; 1% instances), expl (8; 1% instances), root (6; 0% instances), appos (5; 0% instances), advcl (3; 0% instances), amod (3; 0% instances), acl:relcl (1; 0% instances), dislocated (1; 0% instances), iobj (1; 0% instances)
Parents of PRON
nodes belong to 10 different parts of speech: NOUN (672; 52% instances), VERB (466; 36% instances), ADJ (58; 4% instances), ADP (44; 3% instances), PRON (27; 2% instances), PROPN (15; 1% instances), ADV (9; 1% instances), (6; 0% instances), NUM (1; 0% instances), PART (1; 0% instances)
1029 (79%) PRON
nodes are leaves.
170 (13%) PRON
nodes have one child.
74 (6%) PRON
nodes have two children.
26 (2%) PRON
nodes have three or more children.
The highest child degree of a PRON
node is 5.
Children of PRON
nodes are attached using 22 different relations: case (203; 50% instances), acl:relcl (56; 14% instances), punct (37; 9% instances), det (26; 6% instances), cc (15; 4% instances), dep (13; 3% instances), advmod (11; 3% instances), nmod (10; 2% instances), nsubj (9; 2% instances), appos (4; 1% instances), conj (4; 1% instances), obj (3; 1% instances), compound:prt (2; 0% instances), mark (2; 0% instances), acl (1; 0% instances), amod (1; 0% instances), aux (1; 0% instances), cop (1; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances), fixed (1; 0% instances), vocative (1; 0% instances)
Children of PRON
nodes belong to 13 different parts of speech: ADP (217; 54% instances), VERB (43; 11% instances), PUNCT (37; 9% instances), PRON (27; 7% instances), NOUN (25; 6% instances), DET (18; 4% instances), CCONJ (15; 4% instances), PART (12; 3% instances), ADJ (3; 1% instances), AUX (2; 0% instances), PROPN (2; 0% instances), ADV (1; 0% instances), SCONJ (1; 0% instances)