UD Hebrew IAHLTknesset
Language: Hebrew (code: he
)
Family: Afro-Asiatic
This treebank has been part of Universal Dependencies since the UD v2.15 release.
The following people have contributed to making this treebank part of UD: Amir Zeldes, Avner Algom, Noam Ordan, Yifat Ben Moshe, Nick Howell, Shira Wigderson, Omer Strass, Israel Landau, Netanel Dahan, Yael Minerbi, Hilla Merhav, Emmanuelle Kowner, Shuli Wintner, Gili Goldin, Ella Rabinovhich, Vladimir Gurevich.
Repository: UD_Hebrew-IAHLTknesset
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: government, spoken
Questions, comments? General annotation questions (either Hebrew-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [amir • zeldes (æt) georgetown • edu]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | not available |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
Publicly available IAHLT UD Hebrew Treebank’s Knesset section (https://www.iahlt.org/)
UD_Hebrew-IAHLTknesset is a manually annotated UD Treebank of spoken Hebrew data, with approximately 67K words/2800 sentences taken from transcribed proceedings of the Israeli Parliament, the Knesset. The data contains a subset of sentences from the proceedings originally extracted for modeling factuality, and represent sometimes contiguous chunks of 100 parliament discussions, but not necessarily enitre or fully contiguous ones (see the document identifiers under # newdoc id
annotations). Where possible, consecutive sentences are given in their original orders, but with possible gaps in the dialogue. Speaker names are provided as well.
Compatible datasets
The HTB version used in the project was initially converted automatically, then a subset of the converted data was manually validated and adopted as a gold standard for training the model for UD parsing used in Hebrew-IAHLT. The entire parsed data has been manually edited to correct parsing errors, and was automatically QA’ed to apply corrections following updates in the schema. For a fork of UD_Hebrew-HTB (Ha’aretz newswire data) using the same annotation scheme, see:
https://github.com/IAHLT/UD_Hebrew
For an additional UD_Hebrew corpus with the same annotation scheme (Wikipedia articles), see:
https://github.com/UniversalDependencies/UD_Hebrew-IAHLTwiki
NER annotations
The data additionally contains Named Entity annotations in the IAHLT scheme in the MISC annotation Entity=
, illustrated in the following excerpt:
## Acknowledgments
We would like to thank Gili Golden, Shuly Wintner, and Ella Rabinovich for making the original raw data available. We also thank all the people who contributed to this corpus: Amir Zeldes, Hilla Merhav, Israel Landau, Netanel Dahan, Nick Howell, Noam Ordan, Omer Strass, Shira Wigderson, Yael Minerbi and Yifat Ben Moshe.
## References
For academic citations of the IAHLT UD treebanks, please use:
Zeldes, Amir, Nick Howell, Noam Ordan and Yifat Ben Moshe (2022) [A Second Wave of UD Hebrew Treebanking and Cross-Domain Parsing](https://arxiv.org/abs/2210.07873). In: *Proceedings of EMNLP 2022*. Abu Dhabi, UAE, 4331-4344.
```bibtex
@InProceedings{ZeldesHowellOrdanBenMoshe2022,
author = {Amir Zeldes and Nick Howell and Noam Ordan and Yifat Ben Moshe},
booktitle = {Proceedings of {EMNLP} 2022},
title = {A Second Wave of {UD} {H}ebrew Treebanking and Cross-Domain Parsing},
year = {2022},
pages = {4331--4344},
address = {Abu Dhabi, UAE},
url = {https://aclanthology.org/2022.emnlp-main.292/},
}
For academic citations of the underlying Knesset corpus, please use:
Goldin, Gili, Nick Howell, Noam Ordan, Ella Rabinovich, and Shuly Wintner (2024) The Knesset Corpus: An Annotated Corpus of Hebrew Parliamentary Proceedings.
Statistics of UD Hebrew IAHLTknesset
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – Aspect – Case – Definite – Foreign – Gender – HebBinyan – Mood – Number – NumType – Person – Polarity – Poss – Prefix – PronType – Reflex – Tense – Typo – VerbForm – VerbType – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:affix – conj – cop – csubj – csubj:outer – csubj:pass – dep – det – discourse – dislocated – expl – fixed – flat – iobj – list – mark – nmod – nmod:poss – nmod:unmarked – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:unmarked – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 2883 sentences, 50499 tokens and 67007 syntactic words.
- This corpus contains 8181 tokens (16%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 88 types of words that contain both letters and punctuation. Examples: צה"ל, ווד"לים, מע"מ, שיח', בג"ץ, חבר'ה, מנכ"ל, רמטכ"ל, ערוץ-7, ש"ס, שב"כ, אש"ף, א', ד"ר, דו"ח, ה', חו"ל, חל"ת, יו"ר, יש"ע, איו"ש, אל"ף, אלמ"בים, ב', בג"צים, ג'יהאד, כו', כנ"ר, ל"ג, מטכ"ל, מל"ג, ממ"ז, פרופ', צד"ל, תקש"ח, 120(ב)(2, vis-a-vis, אב"י, אי-מיילים, אל-חק, אלמ"ב, בית"ר, בית"רי, ג'ון, ג'סטות, גוז'נסקי, ד', דז'ה, ואל-חורייה, וות"ת
- This corpus contains 15377 multi-word tokens. On average, one multi-word token consists of 2.07 syntactic words.
- There are 6084 types of multi-word tokens. Examples: הכנסת, הזה, הזאת, הממשלה, אדוני, לי, ואני, היושב, ולא, להם, שיש, החוק, לנו, שלא, שהוא, שזה, בכל, וגם, האלה, לו, המדינה, הוועדה, אותו, שאני, שאנחנו, שהם, אותם, לכם, השר, בכנסת, לך, הדברים, שלנו, הציבור, שלו, וזה, בו, במדינת, שצריך, בנושא, בישראל, הזמן, היום, שאין, שלי, הבית, הדבר, היהודי, האוצר, החינוך.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: PART
- This corpus contains 26 lemmas tagged as pronouns (PRON): אותו, איזה, איך, אינו, אנוכי, אני, אנכי, ה, הוא, הזה, היות, הינו, הללו, זה, זהו, י, יי, כולו, כך, כן, מה, מי, מישהו, מתי, עצמו, עצמכם
- This corpus contains 22 lemmas tagged as determiners (DET): איזה, איזשהו, אף, ה, המון, הרבה, כול, כלל, כלשהו, כמה, לא, מדי, מין, מיני, מספיק, מספר, מעט, עוד, קצת, רוב, שאר, שום
- Out of the above, 2 lemmas occurred sometimes as PRON and sometimes as DET: איזה, ה
- This corpus contains 14 lemmas tagged as auxiliaries (AUX): אינו, איננו, אמור, היה, זכאי, חייב, יכל, מוכן, מוכרח, מסוגל, עלול, עשוי, עתיד, צריך
- Out of the above, 5 lemmas occurred sometimes as AUX and sometimes as VERB: אמור, היה, חייב, יכל, צריך
- There are 2 (de)verbal forms:
- Inf
- AUX: להיות
- VERB: לעשות, להיות, להגיד, לדבר, לומר, לתת, לראות, להגיע, לבוא, להביא
- Part
- AUX: יכול, יכולים, יכולה, אינו, אינם, איננו, אינה, אינני, יכולות, צריך
- VERB: רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, נמצאים, מדובר, מבקש
Nominal Features
- Fem
- ADJ: ראשונה, רבה, קודמת, גדולה, אחרת, מקומיות, אחרונות, ערבית, ציבורית, טובה
- AUX: היתה, הייתה, צריכה, יכולה, תהיה, אינה, היו, אמורה, הייתי, יכולות
- AUX-Part: יכולה, אינה, יכולות, איננה, אמורה, אינן, מוכנה, מוכרחה
- DET: איזו, איזושהי, כלשהי
- NOUN: ממשלה, מדינה, וועדה, מדינת, שנים, שנה, ידי, דרך, בעיה, פעם
- NUM: אחת, ארבע, שלוש, שתי, מאות, חמש, עשר, עשרות, שמונה, תשע
- PRON: ה, זאת, היא, אני, זו, הן, י, ן, אותה, את
- PROPN: קורונה, ועדת, כנסת, שבע, ארנונה, ארץ, באר, ברית, הגנה, הגנת
- VERB: אומרת, היתה, חושבת, הייתה, היו, תהיה, רוצה, יודעת, נמצאת, מבקשת
- VERB-Part: אומרת, חושבת, רוצה, יודעת, נמצאת, מבקשת, עומדת, פועלת, יושבת, מגיעה
- Fem,Masc
- AUX: יוכלו
- NOUN: פני, אוכלוסייה, אנוש, טבע, ישע, סופ, עצם, פנים, ציפורי
- PRON: אני, י, נו, אנחנו, אלו, ך, עצמי
- VERB: אמרתי, באו, קיבלתי, שמעתי, אמרת, אסביר, דיברו, הבנו, נצליח, עשיתי
- VERB-Part: רוצה
- Masc
- ADJ: חשוב, נכון, יהודי, גדול, טוב, שני, ראשון, אחרים, אחר, בר
- AUX: היה, יכול, צריך, צריכים, יכולים, יהיה, היו, הייתי, היינו, חייבים
- AUX-Part: יכול, יכולים, אינו, אינם, איננו, אינני, צריך, אינך, אמור, אמורים
- DET: איזשהו, איזושהי, איזשהם, אלו
- NOUN: ראש, חוק, דבר, יושב, חברי, שר, חבר, נושא, אדונ, דברים
- NUM: אחד, שני, אלפי, מיליון, שלושה, ארבעה, חצי, מיליארד, עשרה, שבעה
- PRON: זה, אני, ו, הם, הוא, אנחנו, י, נו, אתה, ם
- PROPN: לבן, קנאביס, כחול, בג"ץ, אוצר, בנק, בית, חוץ, חוק, ליכוד
- SYM: %
- VERB: צריך, רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, היה, נמצאים
- VERB-Part: רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, נמצאים, מדובר, מבקש
- Dual
- NOUN: שנתיים, חודשיים, ביניים, יומיים, שבועיים, פעמיים
- Plur
- ADJ: אחרים, רבים, חדשים, מקומיות, אחרונות, ערבים, חשובים, שונים, אחרונים, נוספים
- AUX: צריכים, יכולים, היו, היינו, חייבים, נוכל, יהיו, יוכלו, אינם, אמורים
- AUX-Part: יכולים, אינם, יכולות, אינן, איננו, אמורים, מסוגלים, עלולים, צריכים
- DET: איזשהם, אלו
- NOUN: חברי, דברים, אנשים, שנים, ילדים, ידי, ימים, בחירות, סטודנטים, אזרחי
- NUM: אלפי, מאות, עשרות, עשרה, אלפים, מיליארדים, מיליוני, שני, עשרת, שתיהן
- PRON: הם, אנחנו, נו, ם, אלה, כם, אתם, הן, אותם, ן
- PROPN: דרעים, זיקים, רביצים, ווד"לים, חיים, כבלים, כספים, מועצות, תותחנים
- SYM: %
- VERB: היו, רוצים, מדברים, יודעים, נמצאים, עושים, אומרים, הולכים, רואים, מבינים
- VERB-Part: רוצים, מדברים, יודעים, נמצאים, עושים, אומרים, הולכים, רואים, מבינים, מנסים
- Plur,Sing
- NOUN: %, אוכלוסייה, בהילות, רגל
- SYM: %
- Sing
- ADJ: חשוב, נכון, יהודי, גדול, טוב, שני, ראשון, קשה, ראשונה, אחר
- AUX: היה, יכול, צריך, היתה, הייתי, יהיה, הייתה, צריכה, תהיה, יכולה
- AUX-Part: יכול, יכולה, אינו, אינה, איננו, אינני, צריך, אינך, איננה, אמור
- DET: איזשהו, איזו, איזושהי, כלשהי
- NOUN: ראש, ממשלה, חוק, דבר, יושב, שר, מדינה, נושא, חבר, אדונ
- NUM: אחד, מיליון, חצי, עשר, אחת, מיליארד, אלף, חמישית, שני, מאית
- PRON: זה, אני, י, ו, הוא, ה, זאת, היא, אתה, ך
- PROPN: קורונה, לבן, קנאביס, כחול, בג"ץ, אוצר, בנק, בית, ועדת, חוץ
- SYM: %
- VERB: רוצה, צריך, אומר, חושב, יודע, היה, אמר, מדובר, מבקש, אומרת
- VERB-Part: רוצה, אומר, חושב, יודע, מדובר, מבקש, אומרת, מדבר, נמצא, קורה
- Acc
- ADP: את, אות, אית
- PRON: ן, ני, ה, כם, אתה, נו
- Gen
- ADP: של
- PRON: י, ו, ה, נו, ם, ך, הם, ן, כם, הו
- Cons
- ADJ: בר, בעלי, חדורי, ארוך, בעל, בת, חסר, חסרי, חסרת, יוצאי
- DET: כל, כמה, הרבה, שום, כול, איזה, אף, המון, מיני, מספר
- NOUN: חברי, חבר, יושב, ראש, מדינת, שר, ידי, בית, הצעת, חברת
- NUM: שני, אלפי, מאות, שתי, אחת, עשרות, אחד, חצי, מיליוני, עשרת
- PROPN: משרד, מדינת, חוק, ועדת, וועדת, ארץ, הר, תל, ראש, יום
- Def
- ADP: ב, ל, כ, ה
- DET: ה, כול
- PRON: י, ו, ה, נו, ם, אותם, ך, הם, אותה, אותו
Degree and Polarity
- Neg
- ADV: לא, אי, אין, אל, בלתי
- AUX: אינו, אינה, אינם, איננו, אינני, אינך, איננה, אינן
- AUX-Part: אינו, אינם, איננו, אינה, אינני, אינך, איננה, אינן
- VERB: אין
- Pos
- VERB: יש, היו, היה, הייתה, יהיה, להיות, יהיו, ישנן, היתה, ישנם
- VERB-Inf: להיות
- VERB-Part: ישנן, ישנם
Verbal Features
- Prog
- VERB-Inf: לעשות
- VERB-Part: אומר, מעורב, בוחר, חוזרים, חוסכים, יושב, מגיעים, מדובר, מוטל, מוצאים
- Imp
- VERB: בואו, שב, בוא, תאמינו, תגידו, תן, תנו, לך, עזבו, אמץ
- Irr
- AUX: היו, הייתי, היה
- VERB: רוצה, מדובר, נותנים, עובר, אומר, אומרים, בא, יוצא, יושבת, לומר
- VERB-Inf: לומר
- VERB-Part: רוצה, מדובר, נותנים, עובר, אומר, אומרים, יוצא, יושבת, מביאה, מסביר
- Fut
- AUX: יהיה, תהיה, נוכל, יהיו, יוכלו, יוכל, תהיו, נהיה, תוכל, אוכל
- VERB: יהיה, תהיה, יהיו, יקרה, נמשיך, נעשה, אשמח, יבוא, נעסוק, נצליח
- VERB-Part: אומר, מיוצגת
- Past
- AUX: היה, היתה, היו, הייתי, הייתה, היינו, היית, הייתם, יכולתי
- VERB: היו, היה, אמר, אמרתי, היתה, הייתה, שמעתי, הגיע, נעשה, אמרו
- VERB-Part: רוצה, אומר, מעורב, בוחר, חוזרים, חוסכים, יושב, יושבת, מוטל, מוצאים
- Pres
- AUX-Part: יכולים, יכול, יכולה, מסוגלים
- VERB: רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, נמצאים, מבקש, אומרת
- VERB-Part: רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, נמצאים, מבקש, אומרת
- Act
- VERB: רוצה, לעשות, אומר, חושב, יודע, היו, להיות, רוצים, להגיד, מדברים
- VERB-Inf: לעשות, להיות, להגיד, לדבר, לומר, לתת, לראות, להגיע, לבוא, להביא
- VERB-Part: רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, מבקש, אומרת, עושים
- Act,Mid
- VERB-Part: נכנסים
- Mid
- VERB: נמצאים, נמצא, להתייחס, נמצאת, נעשה, נראה, להיכנס, להתגבר, מתנהל, נדמה
- VERB-Inf: להתייחס, להיכנס, להתגבר, להילחם, להיזהר, להשתתף, להתגונן, להתווכח, להתפלל, להינשא
- VERB-Part: נמצאים, נמצא, נמצאת, נראה, מתנהל, נדמה, מתחברים, מתנהלים, נפגשים, נקרא
- Mid,Pass
- VERB: נדונו, פוענחו
- Pass
- VERB: מדובר, נעשה, ניתן, מעורב, קשור, ידוע, משולמים, נקבעו, בוצעו, דובר
- VERB-Inf: להיבנות, להיפתר, להיראות
- VERB-Part: מדובר, מעורב, קשור, ידוע, ניתן, משולמים, דרוש, כתוב, מחולקים, מנותקים
Pronouns, Determiners, Quantifiers
- Art
- ADP: ב, ל, כ, ה
- DET: ה
- Dem
- PRON: זה, זאת, אלה, כך, זו, אלו, כן, הללו, זהו, איזו
- Emp
- PRON: עצמו, עצמה, עצמם
- Ind
- DET: איזשהו, איזושהי, איזו, כלשהי, איזשהם
- PRON: מישהו, איזושהי, כן, איזו
- Int
- ADV: איך, למה, האם, איפה, מדוע, מה, כיצד, לאן, היכן, מתי
- DET: איזו, אלו, כמה
- PRON: מה, מי, מתי, מהי, מהם, מיהו
- Neg
- DET: אף
- Prs
- PRON: אני, י, ו, הם, הוא, אנחנו, נו, ה, היא, אתה
- Rel
- ADV: למה, איפה, איך, מתי, היכן, מדוע, מה
- DET: כמה
- PRON: מה, מי, איזה, איך, מהו
- Tot
- DET: כל, כול, כמה
- Card
- NUM: אחד, שני, אחת, שלוש, שמונה, ארבעה, עשר, שלושה, שתי, אלפי
- Ord
- ADJ: שני, ראשון, ראשונה, שלישי, שנייה, 19, 90, עשרים, שלישית, שניה
- Yes
- PRON: י, ו, ה, נו, ם, ך, הם, ן, כם, הו
- Yes
- PRON: עצמם, עצמנו, עצמו, עצמה, עצמי, עצמכם, עצמך, עצמן
- 1
- AUX: הייתי, היינו, נוכל, אינני, יכולתי, נהיה, אוכל, איננו, יהיה, יכולנו
- AUX-Part: אינני, איננו
- PRON: אני, י, אנחנו, נו, עצמנו, אנו, עצמי, ני, כולנו, אנוכי
- VERB: רוצה, חושב, אומר, יודע, מבקש, אמרתי, מדברים, מקווה, חושבת, רוצים
- VERB-Part: רוצה, חושב, אומר, יודע, מבקש, מדברים, מקווה, חושבת, רוצים, אומרת
- 2
- AUX: היית, הייתם, אינך, תהיה, תהיו
- AUX-Part: אינך
- PRON: אתה, ך, כם, אתם, את, עצמכם, עצמך
- VERB: בואו, יודע, אמרת, עושים, רוצים, מדבר, יודעים, אומר, שב, תאמינו
- VERB-Part: יודע, עושים, רוצים, מדבר, יודעים, אומר, אומרת, רוצה, הולכים, הופך
- 3
- AUX: היה, היתה, היו, יהיה, הייתה, תהיה, יהיו, יוכלו, יוכל, יכול
- AUX-Part: יכול, יכולה, יכולים, אינם, אינה, אינו, אינן, איננו, מסוגלים
- PRON: זה, ו, הם, הוא, ה, זאת, היא, ם, אלה, זו
- VERB: היו, היה, אומר, אמר, מדובר, רוצה, נמצאים, אומרים, יודעים, קורה
- VERB-Part: אומר, מדובר, רוצה, נמצאים, אומרים, יודעים, קורה, מדברים, נמצא, רוצים
Other Features
- Abbr
- Yes
- ADJ: אלמ"בים, בית"רי
- NOUN: מע"מ, מנכ"ל, רמטכ"ל, דו"ח, חו"ל, חל"ת, יו"ר, בג"ץ, בג"צים, ממ"ז
- NUM: אל"ף, כ"ט
- PROPN: צה"ל, ש"ס, אש"ף, בג"ץ, יש"ע, שב"כ, ד"ר, כנ"ר, מטכ"ל, צד"ל
- Yes
- Foreign
- Yes
- X: אללה, על, הבאב, הא, פר, Life, blue, of, out, the
- Yes
- HebBinyan
- HIFIL
- VERB: להגיד, להגיע, להביא, להבין, מבין, מבינים, הגיע, מודה, מניח, מסכים
- VERB-Inf: להגיד, להגיע, להביא, להבין, להעביר, להזכיר, להקים, להעלות, להמשיך, להגיש
- VERB-Part: מבין, מבינים, מודה, מניח, מסכים, מכירים, מציע, מכיר, מביאים, מגיע
- HIFIL,HITPAEL
- VERB-Inf: להגזים
- HIFIL,PIEL
- VERB: הסכמת
- HITPAEL
- VERB: להתייחס, להתמודד, יצטרכו, להתגבר, להתחיל, להתפלל, מתכוון, מתנהל, מתנהלים, להשתלט
- VERB-Inf: להתייחס, להתמודד, להתגבר, להתחיל, להתפלל, להשתלט, להשתתף, להתגונן, להתווכח, להסתדר
- VERB-Part: מתכוון, מתנהל, מתנהלים, מצטרף, מתחברים, מתכוונים, מתנהג, מתעסקים, מתקיימים, מידרדר
- HUFAL
- AUX-Part: מוכרח
- VERB: הוכח, הופקעו, הוגש, הוגשו, הושבע, מובן, מוטרד, מותר, הובא, הובאה
- VERB-Part: מובן, מוטרד, מותר, מובלים, מובנת, מודרים, מוזכר, מוטל, מוכח, מוכפל
- NIFAL
- VERB: נמצאים, נמצא, נעשה, ניתן, נראה, נמצאת, להיכנס, נקרא, להילחם, נדמה
- VERB-Inf: להיכנס, להילחם, להיזהר, להינשא, ליהנות, להיאבק, להיאחז, להיבנות, להיגמר, להיכנע
- VERB-Part: נמצאים, נמצא, נראה, נמצאת, נקרא, נדמה, ניתן, נכנס, נפגשים, נקראת
- NITPAEL
- VERB: נשתנה, נתבקשתי, נתגנבה, נתקהלו
- PAAL
- AUX: היה, להיות, היתה, היו, הייתי, יכול, יהיה, הייתה, תהיה, היינו
- AUX-Inf: להיות
- AUX-Part: יכול, יכולה, יכולים
- VERB: רוצה, לעשות, אומר, חושב, צריך, יודע, היו, להיות, רוצים, יודעים
- VERB-Inf: לעשות, להיות, לומר, לתת, לראות, לבוא, לצאת, ללכת, לשמוע, לעמוד
- VERB-Part: רוצה, אומר, חושב, יודע, רוצים, יודעים, אומרת, עושים, אומרים, קורה
- PIEL
- VERB: מדברים, לדבר, מבקש, מדבר, לשנות, מקווה, לאפשר, לקבל, מנסים, לטפל
- VERB-Inf: לדבר, לשנות, לאפשר, לקבל, לטפל, לקיים, לקדם, לנסות, לסיים, לשלם
- VERB-Part: מדברים, מבקש, מדבר, מקווה, מנסים, מבקשים, מבקשת, מאחל, מנסה, מקבל
- PUAL
- AUX-Part: מסוגלים
- VERB: מדובר, מעורב, משולמים, בוצעו, דובר, מחולקים, אושר, חולקו, ייושם, יפוצו
- VERB-Part: מדובר, מעורב, משולמים, מחולקים, מאוחדים, מגובה, מחוסנים, מכוונת, ממולאות, מנותקים
- HIFIL
- Prefix
- Yes
- ADV: אי, בלתי, בין, אנטי, חד, דה, דו, סופר, סוציאל, על
- Yes
- Typo
- Yes
- ADJ: פרד
- ADP: בפנ, הם, כמן, לידי, ה
- ADV: הינה, מדיי
- DET: איזושהי, אלו
- NOUN: אימא, ועדת, חבר, יד, כפ, כשרויות, עינ, שמים, תופעות
- PRON: ה
- PROPN: ד', מפשטים
- SCONJ: כשאשר, מאיו
- VERB: ייצאו, היתה, הרמת, לתבוע, מחייב, מציע, נהייה, נקבע, נקראה
- VERB-Inf: לתבוע
- VERB-Part: מחייב, מציע, נהייה
- Yes
- VerbType
- Mod
- AUX: יכול, צריך, צריכים, צריכה, יכולים, חייבים, חייב, נוכל, יוכלו, יכולה
- AUX-Part: יכול, יכולים, יכולה, יכולות, צריך, אמור, אמורה, אמורים, חייב, מוכן
- VERB: אפשר, צריך, ניתן, מחייב, צריכים, יכול, אסור, אוכל, אין, אמורות
- VERB-Inf: לאפשר, לחייב
- VERB-Part: מחייב, ניתן, יכול, אמורות, אסור, מוכנה, מותר, מחייבים, צריך, צריכות
- Mod
Syntax
Auxiliary Verbs and Copula
- This corpus uses 5 lemmas as copulas (cop). Examples: היה, הוא, זה, אינו, איננו.
- This corpus uses 14 lemmas as auxiliaries (aux). Examples: יכל, צריך, היה, חייב, אינו, אמור, מוכן, מוכרח, עלול, מסוגל, איננו, עתיד, זכאי, עשוי.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (963)
- VERB--NOUN-ADP(מ) (1)
- VERB--NOUN-ADP(מן) (1)
- VERB--NOUN-ADP(מעל) (1)
- VERB--PRON (397)
- VERB--PRON-ADP(כ) (2)
- VERB--PRON-ADP(מתוך) (1)
- VERB-Inf--NOUN (89)
- VERB-Inf--PRON (144)
- VERB-Part--NOUN (366)
- VERB-Part--PRON (1242)
- VERB-Part--PRON-ADP(מ) (1)
- obj
- VERB--NOUN (248)
- VERB--NOUN-ADP(את) (237)
- VERB--PRON (23)
- VERB--PRON-ADP(את) (116)
- VERB--PRON-Acc (3)
- VERB--PRON-Acc-ADP(את) (1)
- VERB-Inf--NOUN (306)
- VERB-Inf--NOUN-ADP(את) (277)
- VERB-Inf--PRON (20)
- VERB-Inf--PRON-ADP(את) (145)
- VERB-Inf--PRON-Acc (6)
- VERB-Part--NOUN (198)
- VERB-Part--NOUN-ADP(את) (201)
- VERB-Part--NOUN-ADP(מ) (2)
- VERB-Part--PRON (34)
- VERB-Part--PRON-ADP(את) (99)
- VERB-Part--PRON-Acc (1)
- iobj
- VERB-Inf--PRON-Acc (1)
Verbs with Reflexive Core Objects
- This corpus contains 13 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: התאים עצמנו, מצא עצמם, בדק עצמנו, מצא עצמי, מצא עצמך, נמצא עצמנו, פרנס עצמם, ראה עצמכם, שאל עצמי, שאל עצמך, שאל עצמנו, שיקם עצמם, שירת עצמנו
- Out of those, 1 lemmas occurred more than once, but never without a reflexive dependent. Examples: התאים
Relations Overview
- This corpus uses 9 relation subtypes: acl:relcl, compound:affix, csubj:outer, csubj:pass, nmod:poss, nmod:unmarked, nsubj:outer, nsubj:pass, obl:unmarked
- The following 2 relation types are not used in this corpus at all: clf, goeswith