Treebank Statistics: UD_Arabic-PADT: POS Tags: NOUN
There are 4858 NOUN
lemmas (31%), 10582 NOUN
types (38%) and 93705 NOUN
tokens (33%).
Out of 17 observed tags, the rank of NOUN
is: 2 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: يَوم، رَئِيس، دَولَة، وَزِير، شَرِكَة، مِصر، عَام، دُولَار، حُكُومَة، مِنطَقَة
The 10 most frequent NOUN
types: مصر، اليوم، رئيس، دولار، الحكومة، العراق، وزير، كل، الرئيس، غير
The 10 most frequent ambiguous lemmas: مَشرُوع (NOUN 453, ADJ 7), مَسؤُول (NOUN 318, ADJ 28), حَدّ (NOUN 210, VERB 5), أَحَد (NOUN 199, NUM 1), صَادِر (NOUN 180, ADJ 47), طَلَب (NOUN 174, VERB 86), فِلَسطِينِيّ (ADJ 412, NOUN 172), حَقّ (NOUN 165, VERB 15), هَدَف (NOUN 153, VERB 52), مُنتَج (NOUN 150, ADJ 5)
The 10 most frequent ambiguous types: مصر (NOUN 768, X 18), اليوم (NOUN 534, X 3), دولار (NOUN 481, X 1), وزير (NOUN 433, X 1), كل (NOUN 415, X 1), الرئيس (NOUN 406, X 1), غير (NOUN 350, ADP 1, ADV 1, VERB 1), عام (NOUN 310, ADJ 33, X 2), عدد (NOUN 290, VERB 2, X 1), العام (NOUN 243, ADJ 158, X 1)
- مصر
- اليوم
- دولار
- NOUN 481: ميراث ب 300 الف دولار يقلب حياة متشرد اميركي
- X 1: أوضح التقرير أيضا ارتفاع الصادرات ب نسبة 28 % ل تصل إلى 4 مليارات و 603 ملايين دولار نتيجة ارتفاع حصيلة الصادرات غير البترولية ب نسبة 16 % ل تصل إلى 2 مليار و 821 مليون دولار ، من السلع النصف مصنعة ل تصل إلى 811 دولار ، و صادرات المواد الخام إلى 223 مليون دولار ، و القطن الخام إلى 345 مليون دولار ، في حين انخفضت صادرات السلع تامة الصنع إلى مليار و 131 مليون دولار .
- وزير
- NOUN 433: وزير الدفاع السوري : بشار الاسد س يلتزم سياسة والده والده
- X 1: و ترافق التأجيل مع جدال في السوق حتى ان تصريحات المسؤولين كانت متضاربة إذ أكد أن وزير الطرح في موعد ما لكن الآخر اكد إرجاء ه ، و حسمت الحكومة الأمر ب أن عملية طرح شركة الاتصالات مرتبط ب حال السوق الدولية ، و طالما ان السوق تعاني منذ فترة هبوطاً شديداً ف الطرح متوقف .
- كل
- الرئيس
- NOUN 406: الرئيس النيجيري في اليابان الثلاثاء المقبل
- X 1: و يعطى هذا اللقاح من خلال حقنة في العضل ، و هو يعمل على توليد أجسام مضادة في مجرى الدم تمنع النيكوتين و الكوكايين من الوصول إلى المخ . و شدد دايفيد أوكسلايد الرئيس التنفيذي ل شركة » اغزنوفا « على الدور الرئيس الذي قد يلعب ه اللقاح في محاربة التدخين .
- غير
- NOUN 350: غير ان الشرطة عادت و ألقت القبض على عادل الذي احيل الى المدعي العام .
- ADP 1: و دعا باول الى مغادرة جميع القوات الاجنبية لبنان غير أن ه قال ان الولايات المتحدة س تأخذ فى عين الاعتبار المصالح اللبنانية و السورية .
- ADV 1: غير أن هويدي لاحظ أن مؤتمر الوطني “ قدم جمال مبارك ب طريقة شرعية ب اعتبار ه الرجل الذي يتبنى فكر الإصلاح “ .
- VERB 1: غير ان باركو نفت ان يشمل البرنامج الامريكى ل اعتراض تهريب المخدرات ب الطائرات فى كولومبيا اقامة ممر جوى من ولاية تشوكا الى منطقة الغابات على الحدود الشمالية الشرقية ل البلاد .
- عام
- NOUN 310: ثم ارتفعت إلى 885 مليون دولار عام 2002 / 2003 .
- ADJ 33: و أكد الدكتور هاني سيف النصر أمين عام الصندوق الاجتماعي ل التنمية فتح مكتب جديد ل الصندوق ب جامعة الأزهر ل تقديم التمويل وفقاً ل أساليب إسلامية .
- X 2: و قالت الكتائب في بيان ل ها أن أحدى مجموعات ها “ أطلقت صاروخا من نوع “ قسام 2 “ ب اتجاه مستوطنة كفار عزة ، ثلاثة صواريخ أخرى ب اتجاه مستوطنتي “ يد مردخاي “ و “ نير عام “ شمال شرق قطاع غزة .
- عدد
- NOUN 290: و هناك طلبات أخرى من عدد من دول الجوار العربي و أمريكا اللاتينية “ .
- VERB 2: اما عن الافكار الاساسية ل المسيحية الصهيونية ف عدد تشابمان قواسم مشتركة بين المسيحيين الصهاينة :
- X 1: تجدر الإشارة إلى أن مجلس الإدارة الذي صدر قرار تشكيل ه من الدكتور عاطف عبيد رئيس مجلس الوزراء الشهر الماضي بضم عدد من المستثمرين و خبراء المال و القانون ، ب الإضافة إلى ممثلي 10 وزارات معنية ب شؤون الاستثمار المحلي و الأجنبي .
- العام
Morphology
The form / lemma ratio of NOUN
is 2.178263 (the average of all parts of speech is 1.761966).
The 1st highest number of forms (24) was observed with the lemma “مَسؤُول”: المسؤول, المسؤولون, المسؤولين, المسئول, المسئولان, المسئولون, المسئولين, المســــؤولين, مسؤول, مسؤولا, مسؤولان, مسؤولاً, مسؤولو, مسؤولون, مسؤولى, مسؤولي, مسؤولين, مسئول, مسئولان, مسئولو, مسئولون, مسئولى, مسئولي, مسئولين.
The 2nd highest number of forms (15) was observed with the lemma “أَرض”: أراض, أراضى, أراضي, أراضيا, أرض, أرضاً, اراض, اراضي, ارض, الأراضي, الأرض, الاراضى, الاراضي, الارض, لاراضيه.
The 3rd highest number of forms (14) was observed with the lemma “أَمر”: أمر, أمرا, أمراً, أمرين, أمور, أموراً, أوامر, الأمر, الأمور, الأوامر, الامر, الامور, امر, امور.
NOUN
occurs with 5 features: Case (93686; 100% instances), Definite (93680; 100% instances), Number (93664; 100% instances), Gender (27; 0% instances), Polarity (19; 0% instances)
NOUN
occurs with 12 feature-value pairs: Case=Acc
, Case=Gen
, Case=Nom
, Definite=Cons
, Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Dual
, Number=Plur
, Number=Sing
, Polarity=Neg
NOUN
occurs with 49 feature combinations.
The most frequent feature combination is Case=Gen|Definite=Def|Number=Sing
(21074 tokens).
Examples: العراق، الحكومة، الرئيس، السوق، المنطقة، النفط، التجارة، العام، الخارجية، التعاون
Relations
NOUN
nodes are attached to their parents using 22 different relations: nmod (46318; 49% instances), obl (11961; 13% instances), nsubj (11215; 12% instances), obl:arg (7947; 8% instances), conj (6670; 7% instances), obj (5392; 6% instances), fixed (1066; 1% instances), root (820; 1% instances), appos (524; 1% instances), xcomp (466; 0% instances), nsubj:pass (418; 0% instances), dep (360; 0% instances), dislocated (149; 0% instances), parataxis (112; 0% instances), orphan (101; 0% instances), ccomp (60; 0% instances), iobj (50; 0% instances), advcl (38; 0% instances), acl (17; 0% instances), acl:relcl (12; 0% instances), csubj (8; 0% instances), amod (1; 0% instances)
Parents of NOUN
nodes belong to 17 different parts of speech: NOUN (49622; 53% instances), VERB (29281; 31% instances), ADJ (4638; 5% instances), NUM (3688; 4% instances), X (3232; 3% instances), ADP (1125; 1% instances), (820; 1% instances), PRON (370; 0% instances), PART (282; 0% instances), DET (244; 0% instances), ADV (189; 0% instances), CCONJ (168; 0% instances), PROPN (23; 0% instances), SCONJ (16; 0% instances), INTJ (5; 0% instances), AUX (1; 0% instances), SYM (1; 0% instances)
17629 (19%) NOUN
nodes are leaves.
31969 (34%) NOUN
nodes have one child.
28879 (31%) NOUN
nodes have two children.
15228 (16%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 29.
Children of NOUN
nodes are attached using 28 different relations: nmod (50403; 35% instances), case (32264; 22% instances), amod (23076; 16% instances), cc (7212; 5% instances), conj (6611; 5% instances), punct (6062; 4% instances), obl (2514; 2% instances), obl:arg (2434; 2% instances), acl (2239; 2% instances), acl:relcl (2075; 1% instances), det (2037; 1% instances), nummod (1901; 1% instances), nsubj (1042; 1% instances), dep (554; 0% instances), mark (546; 0% instances), appos (495; 0% instances), advmod:emph (335; 0% instances), fixed (329; 0% instances), parataxis (306; 0% instances), cop (201; 0% instances), advcl (192; 0% instances), xcomp (143; 0% instances), ccomp (142; 0% instances), orphan (124; 0% instances), advmod (118; 0% instances), csubj (55; 0% instances), aux (51; 0% instances), dislocated (11; 0% instances)
Children of NOUN
nodes belong to 16 different parts of speech: NOUN (49622; 35% instances), ADP (32584; 23% instances), ADJ (23729; 17% instances), CCONJ (7207; 5% instances), X (6805; 5% instances), PRON (6242; 4% instances), PUNCT (6062; 4% instances), VERB (5158; 4% instances), NUM (2410; 2% instances), DET (2311; 2% instances), SCONJ (478; 0% instances), ADV (330; 0% instances), AUX (252; 0% instances), PART (168; 0% instances), PROPN (103; 0% instances), SYM (11; 0% instances)