UD Ottoman Turkish DUDU
Language: Ottoman Turkish (code: ota
)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v2.14 release.
The following people have contributed to making this treebank part of UD: Enes Yılandiloğlu.
Repository: UD_Ottoman_Turkish-DUDU
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: news, fiction, nonfiction, bible, government
Questions, comments? General annotation questions (either Ottoman Turkish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [enes • yilandiloglu (æt) helsinki • fi]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
An Ottoman Turkish dependency treebank annotated in UD style. Created by Enes Yılandiloğlu.
This project comprises 85 sentences that are firstly automaticaly annotated via machamp (Van der Goot et al., 2021). During the training phase, multiple modern Turkish UD treebanks were used. and then manually corrected in a systematic way. Randomly shuffled sentences were written between 14th to 20th century in various genres such as fiction, news, article, registry record, and religious preach. Unfortunately, for this version, the genres can not be told apart by sentence ids. The order of the sentences is chronology based rather than genre based, the earliest written sentence is at the top. In this treebank, Ottoman Turkish transcription alphabet is used.
Acknowledgments
I am immensely grateful to Fatma Elcan for her tremendous help in providing me with sentences.
Statistics of UD Ottoman Turkish DUDU
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Aspect – Case – Definite – Evident – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – Polite – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – aux – case – cc – cc:preconj – ccomp – compound – compound:lvc – conj – cop – csubj – dep – det – discourse – flat – iobj – mark – nmod – nmod:poss – nsubj – nummod – obj – obl – obl:tmod – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 85 sentences, 766 tokens and 813 syntactic words.
- This corpus contains 35 tokens (5%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 42 types of words that contain both letters and punctuation. Examples: ahkâm-ı, asker-i, aḳvâl-i, beḳâ-yı, bi'l-ḳuvve, bâl-ı, bî-pâk, cemâʿat-i, devlet-i, du’ânuñ, edille-i, ferʿiyye-i, fi’l-vâḳi’, fî’l-ḥâl, islâm-ı, ka‘be-i, küfr-i, ma‘rifet, meşrûʿa-i, müteşerriʿîn-i, per-i, risâle-i, sipeh-sâlâr, s̱ebât-ı, tebʿa-i, tercümân-ı, tîr-i, ve’s-selâm, ü’l-beled, ü’l-eyyâmdan, şerʿiyye-i, ḥużûr-ı, ḥuḳûḳ-u, ḥükûmât-ı, ḫalḳ-ı, ḫâne-i, ḳısm-ı, ṣanâyiʿ-i, ṣan’at-ı, ṭarîḳ-i, ‘azamı, ‘ışḳ
- This corpus contains 47 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 41 types of multi-word tokens. Examples: vardır, yoḳdur, degildir, vardı, baḥs̱dir, budur, dilerseñ, düşmendür, ederdi, efkârıdır, gevherdür, götürmektir, idrâkdür, incidir, içerideki, lisândır, merbûṭdur, merkûzdur, muḳaddemâtıdur, neferdir, nevʿindendir, olacaḳtır, oldur, olmuşidi, olursañ, sözdür, tasvîridir, tutarsañ, vardur, vechdür, yoḳtur, şeyhü’l-beled, şâyândır, ʿilmdir, ḥaḳîḳattir, ḳadîmü’l-eyyâmdan, ḳaṣabadur, ḳâyillerdür, ṣâdıḳdır, ṭutsaḳdur, ṭâlibdir.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: SYM, X
- This corpus contains 5 word types tagged as particles (PART): da, daḫı, de, ise, ki
- This corpus contains 9 lemmas tagged as pronouns (PRON): ben, bu, cümle, kendi, ne, nere, o, ol, sen
- This corpus contains 9 lemmas tagged as determiners (DET): bir, birḳac, birḳaç, bu, bâżı, cümle, her, o, ol
- Out of the above, 4 lemmas occurred sometimes as PRON and sometimes as DET: bu, cümle, o, ol
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): degil, i, mi, ol, y
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: i, ol
- There are 4 (de)verbal forms:
- Conv
- VERB: ḳoyub, dizüb, döküb, getürüp, idip, idüb, olup, pişürüb, virüb, ḳoymuşdur
- Fin
- VERB: idesin, olur, ova, avladı, bilesiñiz, bilmem, degmez, diler, dirler, dönsün
- Part
- VERB: olduġu, bulunmadıġı, dedigimiz, eder, gelen, geçen, olan, olduḳtan, olmayan, olur
- Vnoun
- VERB: addolunmaġa, girmekdür, girmesi, gitmenin, götürmek, içmege, söyleye, yapması, yemege, yetişmekdür
Nominal Features
- Fem
- ADJ: nefîsenin, şerîfeʾi, ʿaliyyenüñ
- NOUN: esâsiyesini, meşrûʿa-i, tebʿa-i, ṣûfiyye
- PROPN: ʿos̱mânîyenin
- Plur
- ADJ: iḳbâlle
- AUX: mısınız
- NOUN: begler, aġaçlarıñ, begleri, berekâtıyla, dişleri, edille-i, ferʿiyye-i, fuḳarâya, gözlerine, iḥsânlar
- PRON: bunlardan, cümlesi, cümlesin, onlar
- PROPN: müslimîn
- VERB: başladılar, baḥsedelim, bilesiñiz, dimişler, dirler, döşediler, edebilirsiniz, eyleyelüm, eşitdiler, getürdiler
- VERB-Fin: bilesiñiz, dirler, eyleyelüm, eşitdiler, iderler, istemezler, sevindiler, çalıştılar, ḳarşuladılar, ṭanışdılar
- Sing
- ADJ: dost, düşmen, firistâde, manṣûrla, mecâzîden, merkûz, muʿammâda, nefîsenin, var, şerîfeʾi
- AUX: dur, dir, dır, dür, dı, idi, sañ, tir, degil, di
- NOUN: var, yoḳ, oġlan, üzerine, adın, altına, aġa, idrâk, içine, vaḳt
- NUM: birinci, ikinci, üçüncü
- PRON: bundan, bunuñ, ne, andan, beni, benim, bu, buña, nereye, ol
- PROPN: arizona, bayındır, boġdân, celâlî, cânân, dirse, efendinin, eflâḳ, gûn, hindden
- VERB: olur, dedi, eydür, geldi, idesin, olmaz, ova, addolunmaġa, aldı, atdı
- VERB-Fin: idesin, olur, ova, avladı, bilmem, degmez, diler, dönsün, düşdi, geldi
- VERB-Part: bulunmadıġı, olduḳtan, ḳaldıġını
- VERB-Vnoun: addolunmaġa, girmekdür, girmesi, gitmenin, götürmek, içmege, söyleye, yapması, yemege, yetişmekdür
- Abl
- ADJ: mecâzîden
- NOUN: ʿaşḳtan, atdan, ayaġından, deveden, deñizinden, kütlesinden, lisânlardan, nevʿinden, tafṣiliyyeden, târîḫinden
- PRON: bundan, andan, bunlardan
- PROPN: hindden, paşadan, yemenden
- VERB-Part: olduḳtan
- Acc
- ADJ: şerîfeʾi
- NOUN: adın, bâdâmı, esâsiyesini, keçe, kimseyi, medeniyyet, sitemi, valsini, şeyʾi, ḳapudını
- PRON: beni, cümlesin
- VERB-Part: ḳaldıġını
- Dat
- ADJ: tîze
- NOUN: üzerine, altına, içine, ḥalḳa, cihete, dile, dostına, döşegine, düşmenine, dışarıya
- PRON: buña, nereye
- PROPN: otaġa, pâşâya
- VERB: addolunmaġa, içmege, söyleye, yemege, yürümeye, ḳılına
- VERB-Vnoun: addolunmaġa, içmege, söyleye, yemege, yürümeye
- Gen
- ADJ: nefîsenin, ʿaliyyenüñ
- NOUN: ahkâm-ı, ahâlîmizin, anasınıñ, aġaçlarıñ, beḳâ-yı, dostuñ, du’ânuñ, edille-i, ferʿiyye-i, insânuñ
- PRON: bunuñ, benim
- PROPN: efendinin, iṣfahânuñ, waldteufelin, ʿos̱mânîyenin, ḫıżırın
- VERB-Vnoun: gitmenin
- Ins
- ADJ: iḳbâlle, manṣûrla
- NOUN: berekâtıyla, birligiyle, cihetle, defterile, şekerle
- Loc
- ADJ: muʿammâda
- NOUN: cânibinde, dünyada, dünyâda, dışarıda, eyâletinde, içeride, miḳdârçe, müslümânlıḳta, sefîrinde, vaḳtte
- Nom
- ADJ: dost, düşmen, firistâde, merkûz, var, şâmil, şâyân, ʿazamı, ḥaḳîḳat, ḫaberdâr
- AUX: dur, tur
- NOUN: oġlan, aġa, begler, idrâk, vaḳt, altunı, anası, asker-i, av, ayaġı
- NUM: birinci, ikinci, üçüncü
- PRON: ne, bu, cümlesi, ol, onlar
- PROPN: arizona, bayındır, boġdân, celâlî, cânân, dirse, eflâḳ, gûn, ibrâhim, islâm-ı
- VERB: bulunmadıġı, girmekdür, girmesi, götürmek, itmek, yapması, yetişmekdür, çalışı, çıḳmaḳ
- VERB-Part: bulunmadıġı
- VERB-Vnoun: girmekdür, girmesi, götürmek, yapması, yetişmekdür, çalışı, çıḳmaḳ
- Def
- DET: o, bu, her, ol
- Ind
- DET: bir, birḳaç, bâżı
Degree and Polarity
- Neg
- AUX: degil
- NOUN: yoḳ
- VERB: olmaz, bilmem, bulunmadıġı, degmez, eylemez, gidilmez, istemezler, olmayan, olımadılar, yemezse
- VERB-Fin: bilmem, degmez, istemezler, yemezse, üleşdüremem
- VERB-Part: bulunmadıġı, olmayan
- Pos
- AUX: sañ, di, idi, olunuz, señ
- NOUN: var
- VERB: olur, dedi, eydür, geldi, idesin, olduġu, ova, uçup, ḳoyub, addolunmaġa
- VERB-Conv: ḳoyub, dizüb, döküb, getürüp, idip, idüb, olup, pişürüb, virüb, ḳoymuşdur
- VERB-Fin: idesin, olur, ova, avladı, bilesiñiz, diler, dirler, dönsün, düşdi, eyleyelüm
- VERB-Part: olduġu, dedigimiz, eder, gelen, geçen, olan, olduḳtan, olur, tutar, ḳaldıġını
- VERB-Vnoun: addolunmaġa, girmekdür, girmesi, gitmenin, götürmek, içmege, söyleye, yapması, yemege, yetişmekdür
Verbal Features
- Hab
- VERB: olur, eydür, idesin, olmaz, bilesiñiz, bilmem, degmez, diler, dirler, edebilirsiniz
- VERB-Fin: idesin, olur, bilesiñiz, bilmem, degmez, diler, dirler, iderler, istemezler, olunur
- VERB-Part: eder, olur, tutar
- Imp
- AUX: mı, mısınız
- Perf
- AUX: dir, dur, dır, dür, dı, idi, tir, degil, tır
- VERB: dedi, geldi, olduġu, aldı, atdı, avladı, başladılar, bilsün, bulunmadıġı, dedigimiz
- VERB-Conv: getürüp, idip
- VERB-Fin: avladı, düşdi, eşitdiler, geldi, gitdi, görindi, itdüm, sevindiler, çalıştılar, çekdi
- VERB-Part: olduġu, bulunmadıġı, dedigimiz, geçen, olduḳtan, ḳaldıġını
- VERB-Vnoun: çıḳmaḳ
- Prog
- VERB: gidiyoruz
- Prosp
- VERB: olacaḳ
- Cnd
- AUX: sañ
- VERB-Fin: yemezse, yerse
- Des
- VERB: dinlese
- Imp
- AUX: olunuz
- VERB: ova, bilsün, dönsün, eyleye, getsün, ola, yesün, çıḳara, ṭursun
- VERB-Fin: ova, dönsün, getsün, ola, yesün, çıḳara, ṭursun
- Ind
- AUX: degil
- VERB: dedi, avladı, düşdi, eşitdiler, geldi, getürdiler, getürüp, geçen, gidiyoruz, gitdi
- VERB-Conv: getürüp, idip
- VERB-Fin: avladı, düşdi, eşitdiler, geldi, gitdi, görindi, itdüm, sevindiler, çalıştılar, çekdi
- VERB-Part: geçen
- VERB-Vnoun: çıḳmaḳ
- Opt
- VERB: baḥsedelim, eyleyelüm
- VERB-Fin: eyleyelüm
- Pot
- VERB: edebilirsiniz, üleşdüremem
- VERB-Fin: üleşdüremem
- Fut
- VERB: olacaḳ
- Past
- AUX: dı, di, idi
- VERB: dedi, geldi, olduġu, aldı, atdı, avladı, başladılar, bilmiş, bulunmadıġı, dedigimiz
- VERB-Conv: ḳoymuşdur
- VERB-Fin: avladı, düşdi, eşitdiler, geldi, gitdi, görindi, itdüm, sevindiler, çalıştılar, çekdi
- VERB-Part: olduġu, bulunmadıġı, dedigimiz, olduḳtan, ḳaldıġını
- Pres
- AUX: dir, dur, dır, dür, tir, degil, idi, mı, mısınız, olunuz
- VERB: olur, eydür, idesin, olmaz, ova, bilesiñiz, bilmem, bilsün, degmez, diler
- VERB-Conv: getürüp, idip
- VERB-Fin: idesin, olur, ova, bilesiñiz, bilmem, degmez, diler, dirler, dönsün, eyleyelüm
- VERB-Part: gelen, geçen, olan, olmayan, olur, tutar
- VERB-Vnoun: çıḳmaḳ
- Cau
- VERB: itdirir
- Pass
- VERB: addolunmaġa, gidilmez, olunur, yazılmışdır, ḳırıldı
- VERB-Fin: olunur, ḳırıldı
- VERB-Vnoun: addolunmaġa
- Fh
- AUX: dı, di, idi
- VERB: aldı, atdı, başladılar, döşediler, eyitdi, geldi, getürdiler, geçdi, gördiler, götürdi
- Nfh
- VERB: bilmiş, dimişler, irmiş, olmuş, ḳoymuşdur
- VERB-Conv: ḳoymuşdur
Pronouns, Determiners, Quantifiers
- Art
- DET: bir, o, cümle, birḳaç, bu, bâżı, her, ol
- Dem
- PRON: bu, bundan, bunuñ, bunı, bunlardan, buña
- Ind
- PRON: cümlesin
- Int
- ADV: ne
- PRON: ne, nereye
- Prs
- PRON: sen, andan, beni, benim, kendi, ol, onlar
- Card
- NUM: biñ, bir, on, iki, yedi, dört, elli, sekiz, yetmiş, yüz
- Dist
- NUM: birer
- Ord
- NUM: birinci, ikinci, üçüncü
- Yes
- PRON: kendi
- 1
- PRON: beni, benim
- VERB: baḥsedelim, bilmem, eyleyelüm, gidiyoruz, itdüm, üleşdüremem
- VERB-Fin: bilmem, eyleyelüm, itdüm, üleşdüremem
- 2
- AUX: sañ, mısınız
- VERB: idesin, ova, bilesiñiz, edebilirsiniz, ola, çıḳara
- VERB-Fin: idesin, ova, bilesiñiz, ola, çıḳara
- 3
- ADJ: dost, düşmen, firistâde, iḳbâlle, manṣûrla, mecâzîden, merkûz, muʿammâda, nefîsenin, var
- AUX: dur, dir, dır, dür, dı, idi, tir, degil, di, mı
- NOUN: var, yoḳ, oġlan, üzerine, adın, altına, aġa, begler, idrâk, içine
- NUM: birinci, ikinci, üçüncü
- PRON: bundan, bunuñ, ne, andan, bu, bunlardan, buña, cümlesi, cümlesin, nereye
- PROPN: bayındır, boġdân, celâlî, cânân, dirse, efendinin, eflâḳ, gûn, hindden, ibrâhim
- VERB: olur, dedi, eydür, geldi, olmaz, addolunmaġa, aldı, atdı, avladı, başladılar
- VERB-Fin: olur, avladı, degmez, diler, dirler, dönsün, düşdi, eşitdiler, geldi, getsün
- VERB-Part: bulunmadıġı, olduḳtan, ḳaldıġını
- VERB-Vnoun: addolunmaġa, girmekdür, girmesi, gitmenin, götürmek, içmege, söyleye, yapması, yemege, yetişmekdür
- Infm
- VERB: gidiyoruz
- Plur
- NOUN: ahâlîmizin, lisânımız, türkçemiz
- PRON: cümlesi, cümlesin
- VERB-Part: dedigimiz
- Sing
- ADJ: mecâzîden, şerîfeʾi, ʿazamı
- NOUN: üzerine, adın, içine, altunı, altına, anası, anasınıñ, ayaġı, ayaġından, bedeni
- PROPN: ʿos̱mânîyenin
- VERB: olduġu, bulunmadıġı, girmesi, yapması, çalışı, ḳaldıġını, ḳılına
- VERB-Part: olduġu, bulunmadıġı, ḳaldıġını
- VERB-Vnoun: girmesi, yapması, çalışı
Other Features
- Person[psor]
- 1
- NOUN: ahâlîmizin, intisâbım, lisânımız, pâdişahım, sitemi, sulṭânım, türkçemiz, yanıma, ḳardeşlerim
- VERB-Part: dedigimiz
- 3
- ADJ: mecâzîden, şerîfeʾi, ʿazamı
- NOUN: üzerine, adın, içine, altunı, altına, anası, anasınıñ, ayaġı, ayaġından, bedeni
- PRON: cümlesi, cümlesin
- PROPN: ʿos̱mânîyenin
- VERB: olduġu, bulunmadıġı, girmesi, yapması, çalışı, ḳaldıġını, ḳılına
- VERB-Part: olduġu, bulunmadıġı, ḳaldıġını
- VERB-Vnoun: girmesi, yapması, çalışı
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: i, y.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: degil, ol.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (2)
- VERB--NOUN-Acc (1)
- VERB--NOUN-Nom (10)
- VERB--PRON-Nom (1)
- VERB-Fin--NOUN-Nom (9)
- VERB-Part--NOUN-Nom (1)
- VERB-Vnoun--NOUN-Nom (3)
- obj
- VERB--NOUN-Acc (3)
- VERB--NOUN-Nom (3)
- VERB--PRON-Acc (1)
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Abl (1)
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Nom (4)
- VERB-Fin--PRON (2)
- VERB-Part--NOUN-Nom (3)
- VERB-Vnoun--NOUN-Acc (1)
- iobj
- VERB-Fin--NOUN-Dat (1)
Relations Overview
- This corpus uses 5 relation subtypes: advmod:emph, cc:preconj, compound:lvc, nmod:poss, obl:tmod
- The following 9 relation types are not used in this corpus at all: expl, dislocated, appos, clf, fixed, list, orphan, goeswith, reparandum