Treebank Statistics: UD_Hebrew-IAHLTwiki: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc
.
59940 tokens (43%) have a non-empty value of Gender
.
10721 types (75%) occur at least once with a non-empty value of Gender
.
6236 lemmas (67%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (34543; 25% instances), VERB (8830; 6% instances), ADJ (8672; 6% instances), PRON (5265; 4% instances), AUX (922; 1% instances), NUM (858; 1% instances), PROPN (780; 1% instances), SYM (58; 0% instances), DET (12; 0% instances).
NOUN
34543 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (25489; 74%), Definite=EMPTY (25151; 73%).
NOUN
tokens may have the following values of Gender
:
Fem
(13566; 39% of non-emptyGender
): שנת, ידי, סוכרת, שנים, כנסייה, שנה, ארץ, שנות, מדינה, וועדהFem,Masc
(7; 0% of non-emptyGender
): פניMasc
(20970; 61% of non-emptyGender
): בית, משפט, חוק, אלבום, חלק, שימוש, שיר, פי, דם, שיריםEMPTY
(84): mg/dl, מארק, FFP, דרום, מזרח, מספר, 34, Rising, gl/dl, wellness
Paradigm פנים | Fem,Masc | Masc | Fem |
---|---|---|---|
Definite=Cons|Number=Plur | פני | פני | פני |
Number=Sing | פנים | ||
Number=Plur | פני | פני, פנים | פנים, פני |
Gender
seems to be lexical feature of NOUN
. 96% lemmas (3642) occur only with one value of Gender
.
VERB
8830 VERB tokens (83% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (8655; 98%), VerbForm=EMPTY (6222; 70%), Number=Sing (6179; 70%), Tense=Past (5806; 66%), Voice=Act (5432; 62%).
VERB
tokens may have the following values of Gender
:
Fem
(2621; 30% of non-emptyGender
): החלה, הוקמה, נערכה, הגיעה, הייתה, כללה, החליטה, מהווה, ביצעה, קיבלהFem,Masc
(109; 1% of non-emptyGender
): החלו, נערכו, עמדו, הגיעו, טענו, החזיקו, הפכו, הראו, השתתפו, יצטרכוMasc
(6100; 69% of non-emptyGender
): ניתן, כתב, הלחין, יצא, זכה, החל, כולל, היו, כלל, נמצאEMPTY
(1815): יש, אין, לקבל, לגרום, למנוע, לבצע, ליצור, להופיע, לתת, למצוא
Paradigm כלל | Fem,Masc | Masc | Fem |
---|---|---|---|
HebBinyan=HIFIL|Number=Sing|Tense=Past|Voice=Act | כללה | ||
HebBinyan=PAAL|Number=Sing|Tense=Fut|Voice=Act | יכלול | ||
HebBinyan=PAAL|Number=Sing|Tense=Past|Voice=Act | כלל | כללה | |
HebBinyan=PAAL|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Act | כולל, כלל | כוללת | |
HebBinyan=PAAL|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Pass | כלול | ||
HebBinyan=PAAL|Number=Sing|VerbForm=Part|Voice=Act | כולל | ||
HebBinyan=PAAL|Number=Plur|Tense=Past|Voice=Act | כללו | כללו | |
HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Act | כוללים | כוללות | |
HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Pass | כלולים | ||
HebBinyan=PIEL|Number=Plur|Tense=Past|Voice=Act | כללו |
ADJ
8672 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (6285; 72%).
ADJ
tokens may have the following values of Gender
:
Fem
(3319; 38% of non-emptyGender
): ראשונה, ישראלית, שונות, רבות, שנייה, מערבית, יהודית, חדשה, אחרות, פלסטיניתMasc
(5353; 62% of non-emptyGender
): עליון, ראשון, נוסף, רבים, יהודי, שונים, אחרים, גרעיני, בריטי, ישראליEMPTY
(39): אי, 20, 5, 50, 9, 90, 1, 13, 18, 19
Paradigm רב | Masc | Fem |
---|---|---|
Definite=Cons|Number=Sing | רב | רבת |
Definite=Cons|Number=Plur | רבי | |
Number=Sing | רב | רבה |
Number=Plur | רבים | רבות |
PRON
5265 PRON tokens (93% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Person=3 (5072; 96%), PronType=Prs (4340; 82%), Number=Sing (3977; 76%), Poss=EMPTY (3139; 60%), Case=EMPTY (3084; 59%), Definite=EMPTY (2955; 56%).
PRON
tokens may have the following values of Gender
:
Fem
(1838; 35% of non-emptyGender
): ה, היא, זו, הן, זאת, אותה, ן, אלו, עצמה, ךFem,Masc
(31; 1% of non-emptyGender
): אלו, אני, י, נו, עצמיMasc
(3396; 65% of non-emptyGender
): ו, הם, ם, הוא, זה, אלה, אלו, אותו, עצמו, נוEMPTY
(368): כך, כן, מה, מי, י, נו, אני, ך, כמה, איזה
Paradigm הוא | Fem,Masc | Masc | Fem |
---|---|---|---|
Case=Acc|Definite=Def|Number=Sing|Person=3 | ו | ||
Case=Acc|Definite=Def|Number=Plur|Person=3 | ם | ||
Case=Acc|Number=Sing|Person=1 | ני | ||
Case=Acc|Number=Sing|Person=3 | ו, הו, וֹ | ה | |
Case=Acc|Number=Plur|Person=3 | ם | ||
Case=Gen|Definite=Def|Number=Sing|Person=1|Poss=Yes | י | י | |
Case=Gen|Definite=Def|Number=Sing|Person=2|Poss=Yes | ך | ך, ה | |
Case=Gen|Definite=Def|Number=Sing|Person=3|Poss=Yes | ו, ם, וֹ, י, ן | ה, הּ, ך, ם | |
Case=Gen|Definite=Def|Number=Sing|Person=3|Poss=Yes|Typo=Yes | הם | ||
Case=Gen|Definite=Def|Number=Plur|Person=1|Poss=Yes | נו | ||
Case=Gen|Definite=Def|Number=Plur|Person=3|Poss=Yes | ם, הם | ן, הן, ם, ה | |
Case=Gen|Definite=Def|Number=Plur|Person=3|Poss=Yes|Typo=Yes | ם, ן | ||
Definite=Def|Number=Sing|Person=3 | ו | ה | |
Number=Sing|Person=1 | אני, י | אני, י, ני | אני |
Number=Sing|Person=2 | אתה, ך, ךָ | את, ך | |
Number=Sing|Person=3|Polarity=Pos | הוא, היא, הם | היא, הוא, י | |
Number=Sing|Person=3 | ו, הוא, ך, וֹ, ה, יו, ם | ה, היא, ך, את, הן | |
Number=Sing|Person=3|Typo=Yes | ה | ו | |
Number=Sing|Polarity=Pos | הוא | היא | |
Number=Plur|Person=1 | נו | נו, אנחנו, אנו | |
Number=Plur|Person=2 | כם | ||
Number=Plur|Person=3|Polarity=Pos | הם, ם | הן | |
Number=Plur|Person=3 | הם, ם, ן | הן, ן, הם | |
Number=Plur|Person=3|Typo=Yes | הם | ||
Number=Plur|Polarity=Pos | הם | ||
Number=Plur | הן |
AUX
922 AUX tokens (96% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbForm=EMPTY (799; 87%), Person=3 (712; 77%), Number=Sing (647; 70%), VerbType=EMPTY (591; 64%), HebBinyan=PAAL (541; 59%), Tense=Past (499; 54%).
AUX
tokens may have the following values of Gender
:
Fem
(321; 35% of non-emptyGender
): הייתה, אינה, היו, יכולה, תהיה, אינן, איננה, עלולה, עשויה, תוכלFem,Masc
(22; 2% of non-emptyGender
): היו, יהיוMasc
(579; 63% of non-emptyGender
): היה, היו, אינו, אינם, יכול, יהיה, יכולים, עלול, איננו, צריךEMPTY
(39): להיות, היו, היות, הייתי
Paradigm היה | Fem,Masc | Masc | Fem |
---|---|---|---|
Number=Sing|Person=1|Polarity=Pos|Tense=Past | הייתי | הייתי | |
Number=Sing|Person=1|Polarity=Pos|Tense=Past|VerbType=Cop | הייתי | ||
Number=Sing|Person=1|Tense=Fut | אהיה | ||
Number=Sing|Person=1|Tense=Past|VerbType=Cop | הייתי | ||
Number=Sing|Person=3 | הייתה | ||
Number=Sing|Person=3|Polarity=Pos|Tense=Fut | יהיה | תהיה | |
Number=Sing|Person=3|Polarity=Pos|Tense=Fut|VerbType=Cop | יהיה | תהיה | |
Number=Sing|Person=3|Polarity=Pos|Tense=Past | היה | הייתה | |
Number=Sing|Person=3|Polarity=Pos|Tense=Past|Typo=Yes|VerbType=Cop | הייתה, היה | ||
Number=Sing|Person=3|Polarity=Pos|Tense=Past|VerbType=Cop | היה | הייתה | |
Number=Sing|Person=3|Tense=Fut | יהיה | תהא | |
Number=Sing|Person=3|Tense=Fut|VerbType=Cop | יהיה, יהא | תהיה, תהא | |
Number=Sing|Person=3|Tense=Past | היה | הייתה | |
Number=Sing|Person=3|Tense=Past|VerbType=Cop | היה | הייתה | |
Number=Sing|Person=3|VerbType=Cop | הייתה | ||
Number=Plur|Person=1|Polarity=Pos|Tense=Past | היינו | ||
Number=Plur|Person=1|Tense=Fut|VerbType=Cop | נהיה | ||
Number=Plur|Person=3|Polarity=Pos|Tense=Fut | יהיו | יהיו | יהיו |
Number=Plur|Person=3|Polarity=Pos|Tense=Fut|VerbType=Cop | יהיו | תהיינה | |
Number=Plur|Person=3|Polarity=Pos|Tense=Past | היו | היו | היו |
Number=Plur|Person=3|Polarity=Pos|Tense=Past|Typo=Yes|VerbType=Cop | היה | ||
Number=Plur|Person=3|Polarity=Pos|Tense=Past|VerbType=Cop | היו | היו | היו |
Number=Plur|Person=3|Tense=Fut|VerbType=Cop | יהיו | ||
Number=Plur|Person=3|Tense=Past | היו | היו | |
Number=Plur|Person=3|Tense=Past|VerbType=Cop | היו | היו | היו |
NUM
858 NUM tokens (27% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (731; 85%).
NUM
tokens may have the following values of Gender
:
Fem
(308; 36% of non-emptyGender
): שתי, אחת, שלוש, מאה, ארבע, מאות, עשרות, חמש, שלושים, אחדותFem,Masc
(2; 0% of non-emptyGender
): שלושים, ארבעיםMasc
(548; 64% of non-emptyGender
): אחד, שני, מיליון, שלושה, ארבעה, חמישה, שניים, ששת, חצי, אלףEMPTY
(2269): 2, 1, 2017, 15, 20, 3, 5, 7, 1948, 4
Paradigm שלושים | Fem,Masc | Masc | Fem |
---|---|---|---|
_ | שלושים | שלושים | |
NumType=Card | שלושים | שלושים |
PROPN
780 PROPN tokens (7% of all PROPN
tokens) have a non-empty value of Gender
.
PROPN
tokens may have the following values of Gender
:
Fem
(268; 34% of non-emptyGender
): מכפלה, מערת, חירות, כנסיית, ועדת, חטיבה, קפלת, בורסה, ברית, חקיקהMasc
(512; 66% of non-emptyGender
): בנק, אמפטמין, אדם, אוצר, מעו”ף, כבוד, קבר, ילדי, ניירות, ערךEMPTY
(9667): ישראל, איינשטיין, כנסת, ירושלים, גרמניה, יהודה, ארץ, תל, שומרון, ישו
Paradigm עין | Masc | Fem |
---|---|---|
Definite=Cons | עין | |
עין | עין |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (262) occur only with one value of Gender
.
SYM
58 SYM tokens (40% of all SYM
tokens) have a non-empty value of Gender
.
SYM
tokens may have the following values of Gender
:
Masc
(58; 100% of non-emptyGender
): %, =EMPTY
(88): –, -, /, %, +, :, °, &, (
DET
12 DET tokens (0% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=EMPTY (12; 100%), Definite=Cons (11; 92%).
DET
tokens may have the following values of Gender
:
Fem
(2; 17% of non-emptyGender
): כמות, מחציתMasc
(10; 83% of non-emptyGender
): שאר, מספר, כולםEMPTY
(14165): ה, כל, מספר, רוב, כמה, מרבית, עוד, כלל, מדי, אל
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6647; 99%),
NOUN –[compound]–> NOUN (3613; 52%),
VERB –[nsubj]–> NOUN (2822; 88%),
NOUN –[nmod]–> NOUN (2228; 51%),
NOUN –[acl:relcl]–> VERB (1841; 82%),
NOUN –[conj]–> NOUN (1310; 62%),
NOUN –[nmod:poss]–> PRON (1208; 55%),
VERB –[conj]–> VERB (1085; 79%),
NOUN –[nmod:poss]–> NOUN (748; 52%),
VERB –[nsubj:pass]–> NOUN (717; 96%).