Treebank Statistics: UD_Arabic-PADT: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
161808 tokens (57%) have a non-empty value of Number
.
19064 types (77%) occur at least once with a non-empty value of Number
.
7996 lemmas (52%) occur at least once with a non-empty value of Number
.
The feature is used with 8 part-of-speech tags: NOUN (93664; 33% instances), ADJ (29351; 10% instances), VERB (21296; 8% instances), PRON (10877; 4% instances), DET (4670; 2% instances), NUM (1442; 1% instances), AUX (505; 0% instances), PROPN (3; 0% instances).
NOUN
93664 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Case=Gen (66766; 71%).
NOUN
tokens may have the following values of Number
:
Dual
(911; 1% of non-emptyNumber
): البلدين، الجانبين، الطرفين، اسبوعين، الدولتين، يومين، وزيري، سنتين، الجانبان، عامينPlur
(20661; 22% of non-emptyNumber
): الولايات، الدول، الشركات، الوزراء، دول، شركات، أسعار، العلاقات، البنوك، مصادرSing
(72092; 77% of non-emptyNumber
): مصر، اليوم، رئيس، دولار، الحكومة، العراق، وزير، كل، الرئيس، غيرEMPTY
(41): التليفزيون، الين، أعراض، الجري، حث، طلاسم، إعلان، استحواذ، استغراق، استنفاد
Paradigm يَوم | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Cons | يوم | يومي, يومى | ايام, أيام |
Case=Acc|Definite=Def | اليوم | الأيام, الايام | |
Case=Acc|Definite=Ind | يوما, يوماً | يومين | اياما |
Case=Gen|Definite=Cons | يوم | أيام | |
Case=Gen|Definite=Def | اليوم | اليومين | الايام, الأيام |
Case=Gen|Definite=Ind | يوم | يومين | أيام, ايام |
Case=Nom|Definite=Cons | يوم | أيام | |
Case=Nom|Definite=Def | اليوم | الايام, الأيام | |
Case=Nom|Definite=Ind | يوم |
ADJ
29351 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Case=Gen (19121; 65%), Definite=Def (18961; 65%), Gender=Masc (15122; 52%).
ADJ
tokens may have the following values of Number
:
Dual
(218; 1% of non-emptyNumber
): الماضيين، الكوريتين، القادمين، المقبلين، جافتين، قديمتين، الفنلنديين، قادمين، آخران، آخرينPlur
(1519; 5% of non-emptyNumber
): المصريين، اليهود، كبار، العرب، الفلسطينيين، المسلمين، العراقيين، آخرين، الأجانب، المصابينSing
(27614; 94% of non-emptyNumber
): المصرية، المتحدة، المصري، الماضي، العربية، أي، الحالي، جديدة، الدولية، الفلسطينية
Paradigm مِصرِيّ | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Def|Gender=Masc | المصري | المصريين | |
Case=Acc|Definite=Def|Gender=Fem | المصرية, المصـــرية | ||
Case=Acc|Definite=Ind|Gender=Masc | مصرياً | مصريين | مصريين |
Case=Acc|Definite=Ind|Gender=Fem | مصرية | ||
Case=Gen|Definite=Def|Gender=Masc | المصري, المصرى | المصريين | |
Case=Gen|Definite=Def|Gender=Fem | المصرية, المصريةـ | المصريتين | |
Case=Gen|Definite=Ind|Gender=Masc | مصري | مصريين | |
Case=Gen|Definite=Ind|Gender=Fem | مصرية | مصريات | |
Case=Nom|Definite=Cons|Gender=Masc | مصري | ||
Case=Nom|Definite=Def|Gender=Masc | المصري, المصرى | المصريون | |
Case=Nom|Definite=Def|Gender=Fem | المصرية | ||
Case=Nom|Definite=Ind|Gender=Masc | مصري | مصريون | |
Case=Nom|Definite=Ind|Gender=Fem | مصرية | مصريتان |
VERB
21296 VERB tokens (100% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Person=3 (20900; 98%), Voice=Act (20020; 94%), Gender=Masc (13460; 63%), Aspect=Perf (11215; 53%), Mood=EMPTY (11215; 53%), VerbForm=EMPTY (11215; 53%).
VERB
tokens may have the following values of Number
:
Dual
(214; 1% of non-emptyNumber
): قتلا، اتفقا، أكدا، بحثا، كانا، عقدا، قدما، كانتا، يشيران، يلتقيانPlur
(1233; 6% of non-emptyNumber
): كانوا، قتلوا، يريدون، يعملون، يعيشون، دعوا، يطالبون، طالبوا، فروا، قالواSing
(19849; 93% of non-emptyNumber
): قال، كان، أضاف، كانت، تم، أكد، يتم، يمكن، أشار، أوضح
Paradigm قَال | Sing | Dual | Plur |
---|---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Person=1|VerbForm=Fin|Voice=Act | أقول | نقول | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | يقول | يقولون | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Pass | يقال | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=1|VerbForm=Fin|Voice=Act | أقول | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | يقول | ||
Aspect=Imp|Gender=Fem|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | تقول | ||
Aspect=Perf|Gender=Masc|Person=1|Voice=Act | قلت | ||
Aspect=Perf|Gender=Masc|Person=3|Voice=Act | قال | قالا | قالوا |
Aspect=Perf|Gender=Masc|Person=3|Voice=Pass | قيل | ||
Aspect=Perf|Gender=Fem|Person=3|Voice=Act | قالت |
PRON
10877 PRON tokens (100% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: PronType=Prs (10877; 100%), Person=3 (10131; 93%), Case=Gen (7425; 68%), Gender=Masc (6639; 61%).
PRON
tokens may have the following values of Number
:
Dual
(221; 2% of non-emptyNumber
): هما، كماPlur
(1654; 15% of non-emptyNumber
): هم، نا، نحن، هن، كم، انتم، أنتم، استبعادهم، بأنفسهم، بلادهمSing
(9002; 83% of non-emptyNumber
): ه، ها، هو، هي، ك، ي، ني، هى، أنا، أنت
Paradigm هُوَ | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Gender=Masc|Person=1 | ني | نا | |
Case=Acc|Gender=Masc|Person=2 | ك | كم | |
Case=Acc|Gender=Masc|Person=3 | ه | هما | هم |
Case=Acc|Gender=Fem|Person=3 | ها | هما | هن |
Case=Gen|Gender=Masc|Person=1 | ي, ني | نا, لمساعدتنا | |
Case=Gen|Gender=Masc|Person=2 | ك | كما | كم |
Case=Gen|Gender=Masc|Person=3 | ه, إدانته, استعداداته, انتشاره, بلاده, تجهيزه, حكومته, زنزانته, طائرته, لاراضيه, مستقبله, والده, وغربه | هما | هم, استبعادهم, بأنفسهم, بلادهم, بهم, شفائهم, لهم |
Case=Gen|Gender=Fem|Person=2 | ك | ||
Case=Gen|Gender=Fem|Person=3 | ها, أعضائها, أهدافها, إليها, بضمانها, بفقدانها, بهويتها, تجارتها, تجميدها, تخصيصها, مستشفياتها, مواجهتها, نهايتها | هما | هن |
Case=Nom|Gender=Masc|Person=1 | أنا, انا | نحن | |
Case=Nom|Gender=Masc|Person=2 | أنت | انتم, أنتم | |
Case=Nom|Gender=Masc|Person=3 | هو | هما | هم |
Case=Nom|Gender=Fem|Person=3 | هي, هى, وهي | هما | هن |
DET
4670 DET tokens (79% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Case=Gen (3107; 67%), PronType=Rel (2532; 54%), Gender=Fem (2417; 52%).
DET
tokens may have the following values of Number
:
Dual
(40; 1% of non-emptyNumber
): اللذين، اللتين، هذين، كلا، اللتان، اللذان، هاتين، ذاتا، هاتان، هٰذانPlur
(246; 5% of non-emptyNumber
): الذين، هؤلاء، اللواتي، هٰؤلاء، اولئك، أولٰئك، اللاتى، أولئك، اللاتي، ناSing
(4384; 94% of non-emptyNumber
): التي، الذي، هذه، هذا، ذلك، ذٰلك، التى، هٰذا، تلك، هٰذهEMPTY
(1226): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Gender=Masc | الذي, الذى | اللذين | الذين |
Case=Acc|Gender=Fem | التي, التى | اللتين | |
Case=Gen|Gender=Masc | الذي, الذى | اللذين | الذين |
Case=Gen|Gender=Fem | التي, التى | اللتين | اللواتي, اللاتى, اللاتي |
Case=Nom|Gender=Masc | الذي, الذى | اللذان | الذين |
Case=Nom|Gender=Fem | التي, التى | اللتان |
NUM
1442 NUM tokens (19% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumForm=Word (1442; 100%), Definite=Cons (1117; 77%), Case=Gen (747; 52%).
NUM
tokens may have the following values of Number
:
Dual
(40; 3% of non-emptyNumber
): مليوني، مئتي، ملياري، الفي، بليوني، ألفي، الفى، مليارى، ألفين، الفينPlur
(247; 17% of non-emptyNumber
): ملايين، آلاف، الاف، مليارات، عشرات، بلايين، مئات، العشرات، الملايين، الآلافSing
(1155; 80% of non-emptyNumber
): مليون، مليار، ألف، المئة، بليون، الف، المائة، مليوناً، ملياراً، مليوناEMPTY
(6316): 15، 3، 6، 2، 8، 7، 4، 11، 10، ثلاثة
Paradigm مِليُون | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Cons | مليون, ملـيون | مليوني | ملايين |
Case=Acc|Definite=Def | المليون | ||
Case=Acc|Definite=Ind | مليوناً, مليونا | ||
Case=Acc|Polarity=Neg | مليون | ||
Case=Gen|Definite=Cons | مليون | مليوني | ملايين |
Case=Gen|Definite=Def | المليون | الملايين | |
Case=Gen|Definite=Ind | مليون, ملــيون | ملايين | |
Case=Nom|Definite=Cons | مليون | مليونا | ملايين |
Case=Nom|Definite=Def | الملايين |
AUX
505 AUX tokens (23% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (503; 100%), Person=3 (492; 97%), Gender=Masc (328; 65%), Aspect=Perf (308; 61%).
AUX
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): يكوناPlur
(14; 3% of non-emptyNumber
): كانوا، تكونون، لسنا، ليسوا، نكونSing
(490; 97% of non-emptyNumber
): كان، يكون، ليس، تكون، كانت، ليست، يكن، تكن، كنت، كنEMPTY
(1649): س، قد، سوف، ما، هل، ربما، أ، علّ، لقد
Paradigm كَان | Sing | Dual | Plur |
---|---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Person=1|VerbForm=Fin|Voice=Act | أكون | ||
Aspect=Imp|Gender=Masc|Mood=Ind|Person=2|VerbForm=Fin|Voice=Act | تكون | تكونون | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | يكون | ||
Aspect=Imp|Gender=Masc|Mood=Jus|Person=3|VerbForm=Fin|Voice=Act | يكن | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=1|VerbForm=Fin|Voice=Act | اكون | نكون | |
Aspect=Imp|Gender=Masc|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | يكون | يكونا | |
Aspect=Imp|Gender=Fem|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | تكون | ||
Aspect=Imp|Gender=Fem|Mood=Jus|Person=3|VerbForm=Fin|Voice=Act | تكن | ||
Aspect=Imp|Gender=Fem|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | تكون | ||
Aspect=Perf|Gender=Masc|Person=1|Voice=Act | كنت | ||
Aspect=Perf|Gender=Masc|Person=3|Voice=Act | كان | كانوا | |
Aspect=Perf|Gender=Fem|Person=3|Voice=Act | كانت | ||
Gender=Masc|Mood=Imp|VerbForm=Fin | كن |
PROPN
3 PROPN tokens (1% of all PROPN
tokens) have a non-empty value of Number
.
PROPN
tokens may have the following values of Number
:
Sing
(3; 100% of non-emptyNumber
): العمارة، اللطيفية، الوكرةEMPTY
(242): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، النروج، عبدالمنعم، يومبلغاز، أبوردينة
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod]–> NOUN (24516; 63%),
NOUN –[amod]–> ADJ (15800; 69%),
VERB –[nsubj]–> NOUN (7268; 77%),
VERB –[obl]–> NOUN (6977; 83%),
NOUN –[conj]–> NOUN (4778; 82%),
NOUN –[nmod]–> PRON (3916; 71%),
VERB –[obj]–> NOUN (3771; 74%),
VERB –[obl:arg]–> NOUN (3711; 76%),
VERB –[conj]–> VERB (2352; 91%),
VERB –[ccomp]–> VERB (2310; 88%).