Treebank Statistics: UD_Hebrew-HTB: POS Tags: VERB
There are 1854 VERB
lemmas (17%), 5537 VERB
types (29%) and 14288 VERB
tokens (9%).
Out of 15 observed tags, the rank of VERB
is: 3 in number of lemmas, 2 in number of types and 5 in number of tokens.
The 10 most frequent VERB
lemmas: אמר, _, יש, הגיע, אין, היה, קיבל, עשה, עלה, עבר
The 10 most frequent VERB
types: יש, אין, אמר, יכול, אומר, נראה, עבר, מדובר, היו, חולים
The 10 most frequent ambiguous lemmas: _ (NOUN 365, VERB 326, ADJ 230, ADV 192, AUX 169, CCONJ 109, X 76, PRON 57, SCONJ 46, DET 33), יש (VERB 213, ADV 49), אין (VERB 152, ADV 26, NOUN 2), היה (AUX 774, VERB 146), עלה (VERB 113, NOUN 3), עבר (VERB 111, NOUN 45), נתן (VERB 85, PROPN 3), יכול (VERB 80, ADV 6), בא (VERB 79, ADJ 53), ידע (VERB 79, NOUN 7)
The 10 most frequent ambiguous types: יש (VERB 210, ADV 49), אין (VERB 152, ADV 92, NOUN 2), עבר (VERB 53, NOUN 45), מדובר (VERB 52, ADJ 2), היו (AUX 139, VERB 46), חולים (VERB 45, NOUN 1), היה (AUX 382, VERB 38, X 1), כולל (VERB 37, ADJ 10), עלה (VERB 32, NOUN 1), עולה (NOUN 34, VERB 30)
- יש
- אין
- עבר
- מדובר
- היו
- חולים
- היה
- כולל
- עלה
- עולה
Morphology
The form / lemma ratio of VERB
is 2.986516 (the average of all parts of speech is 1.702584).
The 1st highest number of forms (134) was observed with the lemma “_”: אבדנו, אבקשכם, אומרו, אירגן, אספר, בטוח, ברכתיו, גלומות, דומה, דוקלם, דיקלם, הגזה, הטרידו, היה, היו, היזו, הישווה, הישוותה, היתה, הנחה, העמידני, הפכוהו, הציבו, התחממה, התעקבה, התקים, חדל, חוללה, חיה, חסרות, חשודים, יהיה, יהיו, יחוללו, ייצגו, ייתלוו, יכול, יכולה, יכלו, ינטש, יעבירם, ירבו, ירוקנו, ישנה, יתנו, לאבטח, לבכות, לבלות, לגבות, לגלות, לגשת, לדמיין, להדק, להחיות, להפנות, להקנות, להראות, להרוג, להתחיל, לזכות, לחיות, לחקותו, לכבות, לכלות, לכפות, למנות, לסוכך, לעודדם, לענות, לפנות, לפצותו, לצוות, לצפות, לקבלו, לקחת, לקרות, לראותו, לשבות, לשנות, לשתות, לתכנן, מאוהב, מאפשר, מאפשרות, מאפשרים, מאפשרת, מבוסס, מבוססות, מבוססים, מבוססת, מודע, מוכר, מונה, מידרדר, מכופפת, מכנה, מסולפים, מסקרן, מעורב, מקובלים, מקובלת, משנה, משתנה, מת, נבוך, נגחו, נחוץ, נטש, ניבא, ניבאו, ניצב, ניצבות, ניצל, ניצלה, ניצלו, נשקרה, עדה, עוינת, עולה, עושה, ער, עשה, עשו, פיקפק, פעילות, קיים, רואה, שובה, שונה, שקוע, תהיה, תוכל, תמה, תפוס.
The 2nd highest number of forms (16) was observed with the lemma “נתן”: ייתן, יתן, ליתן, לתת, נותן, נותנות, נותנים, נותנת, ניתן, נתון, נתונה, נתונות, נתונים, נתן, נתנה, נתנו.
The 3rd highest number of forms (15) was observed with the lemma “אמר”: אומר, אומרות, אומרים, אומרת, אמור, אמר, אמרה, אמרו, אמרנו, אמרת, אמרתי, יאמר, יאמרו, לומר, תאמר.
VERB
occurs with 11 features: HebBinyan (12382; 87% instances), Gender (11302; 79% instances), Number (11302; 79% instances), Voice (11299; 79% instances), Person (11273; 79% instances), Tense (6968; 49% instances), VerbForm (6847; 48% instances), HebExistential (534; 4% instances), Polarity (169; 1% instances), Definite (84; 1% instances), Mood (49; 0% instances)
VERB
occurs with 27 feature-value pairs: Definite=Cons
, Gender=Fem
, Gender=Fem,Masc
, Gender=Masc
, HebBinyan=HIFIL
, HebBinyan=HITPAEL
, HebBinyan=HUFAL
, HebBinyan=NIFAL
, HebBinyan=PAAL
, HebBinyan=PIEL
, HebBinyan=PUAL
, HebExistential=Yes
, Mood=Imp
, Number=Plur
, Number=Sing
, Person=1
, Person=1,2,3
, Person=2
, Person=3
, Polarity=Pos
, Tense=Fut
, Tense=Past
, VerbForm=Inf
, VerbForm=Part
, Voice=Act
, Voice=Mid
, Voice=Pass
VERB
occurs with 186 feature combinations.
The most frequent feature combination is HebBinyan=PAAL|VerbForm=Inf|Voice=Act
(799 tokens).
Examples: לעשות, לתת, למנוע, למצוא, לומר, לצאת, לפגוע, לחזור, לעמוד, לפעול
Relations
VERB
nodes are attached to their parents using 22 different relations: root (4746; 33% instances), acl:relcl (2444; 17% instances), conj (1947; 14% instances), xcomp (1565; 11% instances), advcl (1050; 7% instances), ccomp (675; 5% instances), acl (414; 3% instances), dep (331; 2% instances), obl (322; 2% instances), amod (222; 2% instances), parataxis (155; 1% instances), csubj (102; 1% instances), appos (73; 1% instances), nmod (58; 0% instances), compound:smixut (51; 0% instances), nsubj (46; 0% instances), obj (33; 0% instances), case (29; 0% instances), fixed (12; 0% instances), nmod:poss (8; 0% instances), nsubj:cop (4; 0% instances), dislocated (1; 0% instances)
Parents of VERB
nodes belong to 15 different parts of speech: VERB (4792; 34% instances), (4746; 33% instances), NOUN (3142; 22% instances), ADJ (657; 5% instances), ADV (484; 3% instances), PROPN (208; 1% instances), PRON (136; 1% instances), AUX (32; 0% instances), CCONJ (26; 0% instances), SCONJ (17; 0% instances), DET (15; 0% instances), ADP (14; 0% instances), X (10; 0% instances), NUM (8; 0% instances), INTJ (1; 0% instances)
446 (3%) VERB
nodes are leaves.
1655 (12%) VERB
nodes have one child.
2845 (20%) VERB
nodes have two children.
9342 (65%) VERB
nodes have three or more children.
The highest child degree of a VERB
node is 50.
Children of VERB
nodes are attached using 35 different relations: obl (10882; 23% instances), punct (9227; 19% instances), nsubj (6979; 15% instances), mark (4253; 9% instances), obj (3860; 8% instances), advmod (2749; 6% instances), conj (1935; 4% instances), cc (1887; 4% instances), xcomp (1235; 3% instances), advcl (1004; 2% instances), ccomp (867; 2% instances), dep (856; 2% instances), case (561; 1% instances), cop (417; 1% instances), det (208; 0% instances), parataxis (200; 0% instances), compound:smixut (78; 0% instances), nsubj:cop (36; 0% instances), nsubj:outer (35; 0% instances), amod (28; 0% instances), mark:q (26; 0% instances), case:acc (23; 0% instances), compound:affix (22; 0% instances), appos (17; 0% instances), case:gen (13; 0% instances), csubj (11; 0% instances), acl:relcl (10; 0% instances), nummod (7; 0% instances), acl (6; 0% instances), dislocated (6; 0% instances), fixed (5; 0% instances), flat:name (3; 0% instances), nmod (3; 0% instances), nmod:poss (3; 0% instances), discourse (1; 0% instances)
Children of VERB
nodes belong to 15 different parts of speech: NOUN (17138; 36% instances), PUNCT (9227; 19% instances), VERB (4792; 10% instances), SCONJ (4151; 9% instances), ADV (3061; 6% instances), PRON (2800; 6% instances), CCONJ (1996; 4% instances), PROPN (1901; 4% instances), ADP (708; 1% instances), ADJ (523; 1% instances), AUX (422; 1% instances), NUM (391; 1% instances), DET (278; 1% instances), X (64; 0% instances), INTJ (1; 0% instances)