UD Pomak Philotis
Language: Pomak (code: qpm
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.10 release.
The following people have contributed to making this treebank part of UD: Ritván Karahóǧa, Vivian Stamou, Stella Markantonatou.
Repository: UD_Pomak-Philotis
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-NC-SA 3.0
Genre: news, grammar-examples, poetry, fiction
Questions, comments? General annotation questions (either Pomak-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [marks (æt) athenarc • gr]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | assigned by a program, with some manual corrections, but not a full manual verification |
UPOS | assigned by a program, with some manual corrections, but not a full manual verification |
XPOS | not available |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Pomak UD treebank is derived from the Pomak Dependency Treebank, a resource developed and maintained by researchers at the Institute for Language and Speech Processing/Athena R.C. (http://www.ilsp.gr).
The Pomak UD treebank consists of 6351 sentences (86782 tokens). The data in the current release derive from primary texts that will be made available soon on the repositories of the Philotis project (https://www.ilsp.gr/en/projects/filotis-en/). The treebank is licensed under the terms of Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) .
The morphological annotation of the Pomak UD treebank was originally created by applying the morphological database Rodopsky to the texts and then by extensive manual correction by two annotators. The syntactic annotation of the 1.1 release was generated automatically using a Bulgarian model. A detailed revision of the automatic syntactic annotation is due at the end of 2022.
Acknowledgments
We wish to thank all contributors to the original annotation efforts. Morphological annotation was carried out by Ritvan Karahoǧa and Nicolaos Constantinides. Panagiotis Krimpas supported the annotation with expertise in Slavic languages and Stella Markantonatou with expertise in formal grammatical frameworks. Nicolaos Kokkas contributed to the collection of Pomak texts.
References
- Karahóǧa, R. Krimpas, P., Stamou, V., Arampatzakis, V., Karamatskos, D., Sevetlidis, V., Constantinides, N., Kokkas, N., Pavlidis, G., Markantonatou,S. (2022). Morphologically annotated corpora of Pomak. In Proceedings of the 5th Workshop on the Use of Computational Methods in the Study of Endangered Languages: The Use of Computational Methods in the Study of Endangered Languages. Association for Computational Linguistics. Dublin, May 26-27, 2022.
Statistics of UD Pomak Philotis
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – Animacy – Aspect – Case – Definite – Degree – Deixis – DeixisRef – Foreign – Gender – Mood – Number – Number[psor] – NumType – PartTypeQpm – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – aux:q – case – cc – ccomp – compound – compound:redup – conj – csubj – csubj:pass – dep – det – discourse – dislocated – expl – expl:impers – expl:pv – fixed – flat – iobj – mark – nmod – nmod:tmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – obl:arg – obl:lmod – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 2250 sentences and 34348 tokens.
- This corpus contains 4461 tokens (13%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 9 types of words that contain both letters and punctuation. Examples: 'sæ, 'sǽ, 'tam, nacýj-nasám, 'nózek, 'tám, 'túka, ‘sæ, ‘túzi
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 46 word types tagged as particles (PART): ', Ah, Alé, Aléj, Drúgoso, Eh, Ej, Ho, Hájir, Húbove, Isé, Jaút, Káksa, Namóte, Nemój, Ná, Pi, Pépel, bilé, da, dalí, danó, dá, gidí, já, li, marí, my, na, namój, namójte, ne, nemó, ni, nimó, néma, ní, nó, nǽ, sǽ, ta, te, Üüüǘf, éto, óti, či
- This corpus contains 11 lemmas tagged as pronouns (PRON): Ají, ja, kaná, kanása, kim, kólkoso, moj, so, síčko, ízí, žóna
- This corpus contains 63 lemmas tagged as determiners (DET): ', (, Nasradín, adín, adýn, altonǧík, ažýjes, badín, bajá, beš, bir, birkáč, bu, cæl, drug, druz, dur, dva, dvomína, déso, edín, her, hič, inézem, isakvózen, isazí, iséekózen, isélkus, itézi, kak, kakví, kakvóv, kakvóvsa, kakvóvsn, kač, kidí, kutrí, kutrísa, kutrý, kólko, kólkoso, magín, mlóze, mlózi, moj, néšto, níkos, nǽko, nǽkvo, o, samýj, síčko, sǽko, sǽkvo, velí, vrit, vritsǽm, vrítsi, vur, ájni, číjje, što, žýjes
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: kólkoso, moj, síčko
- This corpus contains 6 lemmas tagged as auxiliaries (AUX): býdom, da, li, som, še, šom
- There are 4 (de)verbal forms:
- Conv
- VERB: glǿdava
- Fin
- AUX: je, so, si, som, sa, jo, be, sme, ste, béšo
- VERB: víka, trǽbava, móža, íma, hódi, právi, dam, fáti, vídi, stánava
- Inf
- VERB: plaká, vidé, bra, dumí, igrá, je, kazavá, kazá, praví, právi
- Part
- AUX: bul, byl, búlo, býlo, búla, býla, búli, býli, býly, bil
- VERB: reklól, zøl, reklála, atišlól, vídel, stánal, zǿla, imǽl, imǽlo, tórnal
Nominal Features
- Fem
- ADJ: gulǽma, cǽlo, gladná, gulǽmo, starána, altóneny, górnono, míčko, altóneno, bǽly
- AUX-Part: búla, býla, býly, búly, bíla, bílu
- DET: annó, anná, žýne, ennó, isózi, drúgy, kakvó, isázi, drúgono, enná
- NOUN: godíny, májka, kóštono, rábato, vódo, goróno, žóno, astinomíjena, rábaty, rábata
- NUM: annó, ennó, anná, anníčka, enná
- PRON: jé, tja, jí, ji, týje, hi, jo, te, to, tæ
- PROPN: Aminǽ, Srǽdo, Sóboto, Ǧemilǽ, Kavála, Dráma, Hilmijá, Mára, Máro, Galínka
- VERB-Part: reklála, zǿla, vídela, atišlála, stánala, tórnala, imǽla, stórila, dála, kázala
- Masc
- ADJ: stáryjen, cǽla, móske, mládyjen, gulǽma, húbava, míčkyjen, stári, stárine, čárckyjen
- AUX-Part: bul, byl, búli, býli, bil, bíli
- DET: annók, adín, kutrí, žýjen, žíne, vrítsi, žókne, kotrí, drúgyjen, edín
- NOUN: déne, čulǽkon, čulǽka, bubájko, hašíše, pláden, vakýt, mesecáte, véčera, pótene
- NUM: annók, dvamínana, dva, dvamína, dvomínana, trimínana, ennók, trimína, adínyjen, dvána
- PRON: go, mú, toj, mu, tóga, tíje, tæh, mo, tómu, to
- PROPN: Alí, Ají, Isén, Asíp, Panedélnik, Jerím, Tórnik, Nasradín, Orhán, Azraíl
- VERB-Part: reklól, zøl, atišlól, vídel, stánal, imǽl, tórnal, zǿli, advórnal, rekól
- Neut
- ADJ: kámatno, Pomácko, právo, húbavo, lóšo, míčko, altóneno, cǽlo, kámatnono, parátiko
- AUX-Part: búlo, býlo, bílo
- DET: annó, inazí, drúgo, ennó, žóno, žýne, drúgono, isazí, inakvóne, itazí
- NOUN: vréme, kópeløno, mómičeno, sélo, mómiče, mǽsto, sélono, kúčeno, evró, déte
- NUM: annó, annómune, annóto, drúgono, ennóto, jennó
- PRON: go, to, mu, mú, gu, mo, tómu, žóno
- PROPN: Kélčeno, Kélčetune, Nedéle, Pašavík, Jasǿren, Mustáfčevo, Basájkovo, Bunár, Démirǧik, Gøkčé
- VERB-Part: imǽlo, stánalo, reklólo, skrýto, zǿlo, vídelo, atišlólo, dašlólo, dálo, paminólo
- Hum
- ADJ: móske, stári, stárine, bólni, góli, móski, gulǽmehne, húbavi, mládi, Basájkovlæne
- AUX-Part: búli, býli, bíli
- DET: žíne, vrítsi, mlózi, vritsǽh, žǽhne, drúzine, vritsǽm, kutróga, kakvǽh, drúgine
- NUM: dvamínana, dvomínana, dvamína, trimínana, trimína, dvomína, trimínata, čétrimina, annóga, dvamínem
- PRON: tíje, tæh
- VERB-Part: zǿli, našlíli, fátili, imǽli, reklíli, vídeli, ískali, atišlí, atišlíli, dáli
- Nhum
- ADJ: kámatny, čúzdy, dívyne, gládny, golǽmyne, gulǽmy, húbavy, míčky, nóvy, parčé
- DET: drúgy, žýne, drúgyne, Kakvý, ajnés, dvomína, inéj, mlóze
- PRON: to
- VERB-Part: izlǽly, zǿly, Vlǽly, atfóreny, pasrǿšnaly, zatvóreny, artósaly, dádeny, fajdalý, izgorǽly
- Coll
- NOUN: brátje, dečjána, cvetjé, dečjá, kámeņe, lǘdje, ǧíņeno, cvetjéno, kóreņe, Duvárjeno
- Count
- ADJ: mláda
- NOUN: déne, arkadáše, méseca, tumafíle, véčera, ergáte, fránka, gr, hajvánka, hóreha
- Plur
- ADJ: móske, altóneny, húbavy, stári, stárine, bǽly, stáryte, visóky, bólni, gládny
- AUX: so, sa, sme, ste, búli, býli, býly, búly, bého, bíli
- AUX-Fin: so, sa, sme, ste, bého
- AUX-Part: búli, býli, býly, búly, bíli
- DET: žíne, žýne, vrítsi, drúgy, mlózi, inézi, vritsǽh, drúgyne, isézi, žǽhne
- NOUN: godíny, rábaty, insán, líry, ačíne, parý, insána, insánon, kišǽh, drípy
- NUM: tri, dve, dvamínana, dva, jedí, dvéne, kyrk, 6, dvamína, dvomínana
- PART: Namóte
- PRON: gi, mí, tíje, nýje, tæh, mi, to, nú, vú, námi
- PROPN: Nedéleta
- VERB-Fin: ídot, víkot, právet, vídet, umǿt, jedót, stóret, ímot, fátiho, hódet
- VERB-Part: zǿli, našlíli, fátili, imǽli, reklíli, vídeli, ískali, atišlí, zǿly, atišlíli
- Sing
- ADJ: stáryjen, cǽla, gulǽma, cǽlo, kámatno, húbavo, mládyjen, míčko, húbava, altóneno
- AUX: je, si, som, bul, byl, búlo, býlo, jo, be, búla
- AUX-Fin: je, si, som, jo, be, béšo, sa, še, e, ja
- AUX-Part: bul, byl, búlo, býlo, búla, býla, bil, bíla, bílo, bílu
- DET: annó, annók, inazí, adín, bir, kutrí, žýjen, ennó, anná, kakvó
- NOUN: déne, májka, čulǽkon, kóštono, vréme, rábato, vódo, čulǽka, bubájko, kópeløno
- NUM: annó, annók, ennók, ennó, adínyjen, adín, jedín, 1, 1.324, anná
- PART: namój, nimó, Namóte, Nemój, namójte, nemó
- PRON: go, mú, jé, toj, mu, mí, tja, ja, tí, jí
- PROPN: Ksánti, Elláda, Ǧumágün, Aminǽ, Srǽdo, Isén, Ǧemilǽ, Aleksandrúpoli, Asíp, Panedélnik
- VERB: víka, reklól, trǽbava, móža, íma, hódi, zøl, právi, reklála, dam
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, dam, fáti, vídi, stánava
- VERB-Part: reklól, zøl, reklála, atišlól, vídel, stánal, zǿla, imǽl, imǽlo, tórnal
- Acc
- ADJ: cǽla, cǽlo, móske, gulǽma, húbava, húbavo, míčko, Pomácko, gulǽmo, kámatno
- DET: annó, annók, ennó, žýne, drúgy, inazí, žókne, drúgo, ennók, isózi
- NOUN: godíny, déne, kóštono, rábato, vódo, čulǽka, goróno, hašíše, pláden, vréme
- NUM: annó, annók, dvamína, ennók, dvamínana, trimína, ennó, annógate, annókne, annóto
- PRON: só, go, jé, gi, sa, mó, tóga, móne, tó, tæh
- PROPN: Ksánti, Elláda, Ǧumágün, Srǽdo, Aleksandrúpoli, Panedélnik, Sóboto, Kavála, Néa, Siría
- VERB-Part: skrýto, platéno, kendísany, spúšanokne, ukrádena, umaréno, umrǽtokne, zǿte, adbávena, apléskano
- Gen
- ADJ: míčkumune, stároj, stárumune, Evréjinu, Momójne, Pomáčinu, Pílevomne, altónenune, jódremne, lóšomne
- DET: kutrómu, žómune, annój, Katrómu, annómu, drúgumune, vritsǽm, bannómu, drúgune, inózimu
- NOUN: májci, bubájku, kópeløtune, žanójne, brátu, mómičotu, vasiļázune, momójne, synúne, čárüne
- NUM: annómune, dvamínem
- PRON: sí, mú, mí, mu, tí, jí, ji, mi, ti, hi
- PROPN: Kélčetune, Azraílu, Mustafú, Nasradínu
- VERB-Part: davédenu
- Nom
- ADJ: stáryjen, gulǽma, mládyjen, gladná, míčkyjen, starána, stárine, čárckyjen, gulǽm, gulǽmyjen
- DET: adín, kutrí, žýjen, inazí, žíne, anná, vrítsi, kotrí, drúgyjen, mlózi
- NOUN: májka, čulǽkon, bubájko, astinomíjena, mómičeno, rábata, žanána, kópeløno, čulǽk, insán
- NUM: dvamínana, dvomínana, trimínana, annó, adínyjen, adín, trimínata, anná, anníčka, annóga
- PRON: toj, tja, ja, ty, to, tíje, nýje, výje, te, teh
- PROPN: Aminǽ, Kélčeno, Isén, Ǧemilǽ, Ají, Alí, Hilmijá, Jerím, Nasradín, Orhán
- VERB-Part: naučény, zatvóren, naučéna, ispísana, kápnati, nadút, pæt, pǽti, ugradéna, umrǽt
- Voc
- ADJ: májčin, stárku, červéno
- NOUN: sýne, ma, báte, dǽdo, bubá, brátu, májo, pópe, čárü, brátku
- PROPN: Aminǽ, Kíme, Mustufá, BABU, Hamdí, Hasán, Hóǧa, Jaút, Jerím, Márta
- Def
- ADJ: stáryjen, mládyjen, míčkyjen, starána, górnono, stárine, čárckyjen, gulǽmyjen, míčkokne, stárono
- DET: žýjen, žíne, žýne, žókne, žóno, drúgyjen, drúgono, drúganek, annóno, drúgokne
- NOUN: čulǽkon, kóštono, kópeløno, mómičeno, goróno, astinomíjena, žanána, mesecáte, pótene, momána
- NUM: dvamínana, dvéne, dvomínana, trimínana, tríne, dvána, adínyjen, trimínata, 38no, 4no
- PRON: síčkono, síčkoto, síčkona, síčkoso
- PROPN: Kélčeno, Kélčetune, Balkánase, KEPno, Lýǧeno
- VERB-Part: spúšanokne, umrǽtokne, abijískavanata, apítana, atfórenyne, atékanokne, davédenono, izšlévenata, mésenono, navartǽtana
- Ind
- ADJ: mlógo, razý, cǽla, gulǽma, málko, ájni, mlógu, cǽlo, kámatno, mífko
- DET: annó, annók, adín, bir, ennó, anná, drúgy, drúgo, edín, ennók
- NOUN: godíny, déne, májka, vréme, rábato, vódo, čulǽka, bubájko, hašíše, pláden
- NUM: annó, tri, dve, annók, dva, jedí, kyrk, 6, dvamína, 10
- PRON: síčko, žóno
- PROPN: Ksánti, Elláda, Ǧumágün, Aminǽ, Srǽdo, Isén, Aleksandrúpoli, Asíp, Panedélnik, Sóboto
- VERB-Part: skrýto, naučény, zatvóren, naučéna, platéno, ukrádena, atfóreny, ispísana, kendísany, kápnati
Degree and Polarity
- Aug
- ADJ: pýlniček
- PROPN: Apátkava, Basájkovo
- Cmp
- ADJ: húbavo
- ADV: pó, sǽ
- Dim
- ADJ: kámatnišičky, mǿčko, stárku
- ADV: usulétanka, annínkuš, bórško, mífčinko
- DET: samíček, samíčko
- NOUN: bábičkana, kótenceno, kópelčeno, kópelče, kámenkane, kúčenceno, žábinkana, kutújko, bábička, kutújkono
- NUM: anníčka, trínky
- PROPN: Galínka, Pepelívka
- Sup
- ADV: naj
- Neg
- PART: ne, na, néma, namój, ni, Hájir, Húbove, Isé, Káksa, Namóte
- VERB: néma, némame, némot, némaš, némom, Nišóm, davájte, gledáj, hvalíjte, klaj
- VERB-Fin: néma, némame, némot, némaš, némom, Nišóm, davájte, gledáj, hvalíjte, klaj
Verbal Features
- Imp
- AUX-Fin: je, so, si, som, sa, jo, be, sme, ste, bého
- VERB: víka, trǽbava, móža, íma, hódi, právi, stánava, íšte, imǽl, imǽlo
- VERB-Conv: glǿdava
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, stánava, íšte, víkot, právet
- VERB-Inf: plaká, bra, dumí, igrá, je, kazavá, praví, právi, ču, čuká
- VERB-Part: imǽl, imǽlo, mógal, móčil, imǽli, čákal, hódil, imǽla, ískal, ískali
- Iter
- VERB-Fin: rečášo, zasmǽšo, ídešo
- Perf
- AUX-Fin: béšo
- AUX-Part: bul, byl, búlo, býlo, búla, býla, búli, býli, býly, bil
- VERB: reklól, zøl, reklála, dam, fáti, vídi, stóri, atišlól, vídel, íde
- VERB-Fin: dam, fáti, vídi, stóri, íde, ídot, stáne, dadé, dójde, vídet
- VERB-Inf: vidé, kazá
- VERB-Part: reklól, zøl, reklála, atišlól, vídel, stánal, zǿla, tórnal, stánalo, vídela
- Prog
- AUX-Fin: béšo
- VERB-Fin: trǽbavašo, imǽšo, móžašo, glǿdašo, iméša, iméšo, kázavašo, rǘkahme, adbáveho, gļódašo
- Imp
- VERB-Fin: daj, jála, zǿmij, hájde, viš, čákyj, Hátte, fýrkyj, kážyj, spúsnijte
- Ind
- AUX-Fin: je, so, si, som, sa, jo, be, sme, ste, béšo
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, dam, fáti, vídi, stánava
- Past
- AUX-Fin: be, béšo, bého, e
- AUX-Part: bul, byl, búlo, býlo, búla, býla, búli, býli, býly, bil
- VERB-Fin: fáti, fátiho, réče, trǽbavašo, dójde, stána, zø, imǽšo, stóri, víde
- VERB-Part: reklól, zøl, reklála, atišlól, vídel, stánal, zǿla, imǽl, imǽlo, tórnal
- Pres
- AUX-Fin: je, so, si, som, sa, jo, sme, ste, še, bého
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, dam, vídi, stánava, íde
- Act
- AUX: je, so, si, som, sa, bul, byl, búlo, býlo, jo
- AUX-Fin: je, so, si, som, sa, jo, be, sme, ste, béšo
- AUX-Part: bul, byl, búlo, býlo, búla, býla, búli, býli, býly, bil
- VERB: víka, reklól, trǽbava, móža, íma, hódi, zøl, právi, reklála, dam
- VERB-Conv: glǿdava
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, dam, fáti, vídi, stánava
- VERB-Inf: plaká, vidé, bra, dumí, igrá, je, kazavá, praví, právi, ču
- VERB-Part: reklól, zøl, reklála, atišlól, vídel, stánal, zǿla, imǽl, imǽlo, tórnal
- Pass
- VERB-Part: skrýto, naučény, zatvóren, naučéna, platéno, ukrádena, atfóreny, ispísana, kendísany, kápnati
Pronouns, Determiners, Quantifiers
- Dem
- ADV: itám, isǽ, inagáne, inýj, itúzi, itýj, tam, isýj, sæ, itúj
- DET: inazí, isózi, bu, inélkus, inézi, isózek, isázi, isézi, inózek, isazí
- Emp
- DET: samý, samíček, samýj
- Ind
- ADV: nǽjde, bannóš, annagý, badín, kugá, drúzišno
- DET: annó, annók, nǽko, adín, bir, ennó, anná, drúgy, drúgo, drúgyjen
- Int
- ADV: kadé, kak, kugá, kakvóv, kogá, kutró
- DET: kutrí, kólko, kakvó, kotrí, kakvá, kakvý, katró, kólku, kutrómu, kakvóv
- PRON: kaná, kakná, kaknani, Móne
- Prs
- DET: tógavokne, tójnono, tógavono, móto, nášono, nášoso, nášyse, tváta, mókse, móse
- PRON: só, go, sí, mú, jé, mí, gi, toj, mu, to
- Rel
- ADV: kugána, kákna, kadéna, kákta, Kugáta, kadéta, kogána, Agýta, Kugáno, kadéno
- DET: žýjen, žíne, žýne, žókne, žóno, kólkoto, žǽhne, žána, žómune, kakvóto
- PRON: kanána, kanáta, kaknána, kaknása, Kanása, kaknáno, kaknáta, kólkono
- Tot
- DET: vrit, vrítsi, sǽko, her, vritsǽh, vritsǽm, sǽkvo, Bajá, Dur, beš
- PRON: síčkono, síčko, síčkoto, síčkona, síčkoso
- Card
- ADJ: pǽti, trimína
- DET: annók, adín, annó
- NUM: annó, tri, dve, annók, dvamínana, dva, jedí, dvéne, kyrk, 6
- Ord
- ADJ: birinǧíto, ikinǧí, pórvokne, pórvono, üčünǧǘno, Jedinǧí, bešinǧíno, birinǧí, bǽlokne, dørtünǧǘno
- NUM: dørdünǧǘno, üčünǧǘno
- Yes
- ADJ: Aminínana, BUBÁJKOVYJEN, Išín, Melihínana, Orhánavyjen, bubájkovo, bábinana, dǽdavono, dǽdovyne, jenná
- DET: tógavokne, tójnono, tógavono, móto, nášono, nášoso, nášyse, tváta, mókse, móse
- PRON: mu, ji, mi, ti, hi, nu, vu, mo
- Yes
- PRON: só, sí, sa, se, nǽ
- 1
- AUX-Fin: som, sme, bého, šom
- DET: móto, nášyse, mókse, móse, móso, nášasek, nášokse, nášoso, ma, mo
- PRON: mí, ja, mó, móne, mi, nýje, nú, námi, nu, výje
- VERB-Fin: dam, íštom, vídem, ídeme, znom, kážom, móžom, ímom, íšteme, mólem
- 2
- AUX-Fin: si, ste, be, še
- DET: tváta, tvóto, tvóso, vaš, vášoso
- PART: namój, Namóte, nimó, Drúgoso, Nemój, namójte, nemó
- PRON: tí, ty, ti, tó, tébe, vú, ta, vámi, výje, te
- VERB-Fin: vídiš, íšteš, daj, jála, zǿmij, ímaš, hájde, znoš, dadéš, víkaš
- 3
- AUX: je, so, sa, jo, be, béšo, bého, e, ja, še
- AUX-Fin: je, so, sa, jo, be, béšo, bého, e, ja, še
- DET: tógavokne, tójnono, tógavono, nášono, tógavoto, nášoso, síčko, síčkono, síčkoso, tógavo
- PRON: go, mú, jé, gi, toj, mu, to, tja, jí, ji
- VERB: víka, trǽbava, móža, íma, hódi, právi, fáti, vídi, stánava, íde
- VERB-Fin: víka, trǽbava, móža, íma, hódi, právi, fáti, vídi, stánava, íde
- VERB-Part: císti
- Plur
- DET: nášoso, nášyse, nášasek, nášokse, nášono, nášo, nášyjes, nášyte, síčko, tǽhan
- PRON: mi, nu, vu
- Sing
- DET: tógavokne, tójnono, tógavono, tváta, mókse, móse, móto, tvóto, tógavoto, ma
- PRON: mu, ji, ti, mi, hi, mo
Other Features
- Abbr
- Yes
- NOUN: DEIno, TV, cm
- PROPN: KEPno, KKE, PAME, ogá
- Yes
- Deixis
- Prox
- ADJ: stáryte, birinǧíto, pomáckyse, Máminata, altónenoto, čórnoso, Teškáta, altonǧíckokse, arápckyte, bǽloso
- ADV: isǽ, itúzi, kákta, sabályjinto, itýj, isýj, sæ, akšálmyjinto, itúj, 'sæ
- DET: isózi, isézi, isózek, isázi, isazí, kólkoto, isélkus, itazí, kakvóto, ajsóva
- NOUN: mesecáte, mesecáse, astinomíjeta, düņóso, insánase, kóštoso, momóso, Pomácese, mečkáta, pótete
- NUM: trimínata, Licáta, annógate, annóto, dvomínasa, dvomínata, dvomínehte, dvése, dvéte, ennóto
- PRON: kanáta, kaknása, síčkoto, Kanása, kaknáta, síčkoso
- PROPN: Balkánase
- VERB-Part: abijískavanata, izšlévenata, stánatoto, umarénite, šlévenata
- Remt
- ADJ: stáryjen, mládyjen, míčkyjen, starána, górnono, stárine, čárckyjen, gulǽmyjen, míčkokne, stárono
- ADV: itám, kugána, kákna, kadéna, inagáne, inýj, tam, akšámlajinno, kogána, kákno
- DET: inazí, žýjen, žíne, žýne, žókne, žóno, drúgyjen, drúgono, inélkus, drúganek
- NOUN: čulǽkon, kóštono, kópeløno, mómičeno, goróno, astinomíjena, žanána, pótene, momána, rǽkono
- NUM: dvamínana, dvéne, dvomínana, trimínana, tríne, dvána, adínyjen, 38no, 4no, 8no
- PRON: kanána, síčkono, kaknána, kaknáno, kólkono, síčkona
- PROPN: Kélčeno, Kélčetune, KEPno, Lýǧeno
- SCONJ: agýna, agána, kugána
- VERB-Part: spúšanokne, umrǽtokne, apítana, atfórenyne, atékanokne, davédenono, mésenono, navartǽtana, primázanokne, spúšanono
- Prox
- DeixisRef
- 1
- ADJ: pomáckyse, čórnoso, altonǧíckokse, bǽloso, désnokse, dólnoso, fóroso, gelínckokse, húbavyjet, lǽvokse
- ADV: isǽ, itúzi, isýj, sæ, itúj, 'sæ, ajtús, isǽna, sagáne, túzi
- DET: isózi, isézi, isózek, isázi, isazí, isélkus, ajsóva, isój, isók, izí
- NOUN: mesecáse, düņóso, insánase, kóštoso, momóso, Pomácese, séloso, žyvótase, astanǿso, belidjása
- NUM: dvomínasa, dvése, trimínasa
- PRON: kaknása, síčkoso
- PROPN: Balkánase
- 2
- ADJ: stáryte, birinǧíto, Máminata, altónenoto, Teškáta, arápckyte, gulǽmata, gulǽmite, gulǽmoto, húbavokte
- ADV: kákta, sabályjinto, itýj, akšálmyjinto, Kugáta, kadéta, itúka, tagáne, tugáva, akšámlajinto
- DET: kólkoto, kakvóto, itazí, itélkus, tváta, žýte, itózek, móto, tvóto, tógavoto
- NOUN: mesecáte, astinomíjeta, mečkáta, pótete, jaráta, játoto, momáta, rekáta, Pótet, bábata
- NUM: trimínata, Licáta, annógate, annóto, dvomínata, dvomínehte, dvéte, ennóto
- PRON: kanáta, síčkoto, kaknáta
- VERB-Part: abijískavanata, izšlévenata, stánatoto, umarénite, šlévenata
- 1
- Foreign
- Yes
- NOUN: ergatikó, gimnásio, kéntro, pálto, vulíno
- X: spíti, sto, voítia, Allahýn, Læ, etmíš, ilé, ilǽhæ, izní, íllelloh
- Yes
- PartTypeQpm
- Ind
- PART: nó
- Neg
- PART: ní, nǽ
- Tot
- PART: sǽ
- Ind
Syntax
Auxiliary Verbs and Copula
- This corpus does not contain copulas.
- This corpus uses 6 lemmas as auxiliaries (aux). Examples: som, da, še, býdom, li, šom.
- This corpus uses 2 lemmas as passive auxiliaries (aux:pass). Examples: som, býdom.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (25)
- VERB-Fin--NOUN-Acc-ADP(ad) (2)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Nom (356)
- VERB-Fin--NOUN-Nom-ADP(na) (2)
- VERB-Fin--NOUN-Voc (1)
- VERB-Fin--PRON (22)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Gen (1)
- VERB-Fin--PRON-Nom (208)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN (1)
- VERB-Part--NOUN-Acc (27)
- VERB-Part--NOUN-Gen (3)
- VERB-Part--NOUN-Nom (596)
- VERB-Part--NOUN-Voc (1)
- VERB-Part--PRON (12)
- VERB-Part--PRON-Nom (141)
- VERB-Part--PRON-Nom-ADP(nah) (1)
- obj
- VERB--PRON-Acc (1)
- VERB-Conv--NOUN (1)
- VERB-Fin--NOUN (5)
- VERB-Fin--NOUN-Acc (796)
- VERB-Fin--NOUN-Acc-ADP(an) (1)
- VERB-Fin--NOUN-Acc-ADP(atpréš) (1)
- VERB-Fin--NOUN-Acc-ADP(da) (1)
- VERB-Fin--NOUN-Acc-ADP(faf) (2)
- VERB-Fin--NOUN-Acc-ADP(na) (2)
- VERB-Fin--NOUN-Acc-ADP(prez) (1)
- VERB-Fin--NOUN-Acc-ADP(s) (1)
- VERB-Fin--NOUN-Acc-ADP(sas) (2)
- VERB-Fin--NOUN-Acc-ADP(za) (2)
- VERB-Fin--NOUN-Gen (5)
- VERB-Fin--NOUN-Nom (39)
- VERB-Fin--PRON (107)
- VERB-Fin--PRON-ADP(amá) (1)
- VERB-Fin--PRON-Acc (498)
- VERB-Fin--PRON-Gen (20)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--NOUN-Nom (1)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-Acc (3)
- VERB-Part--NOUN (3)
- VERB-Part--NOUN-Acc (457)
- VERB-Part--NOUN-Acc-ADP(ad) (1)
- VERB-Part--NOUN-Acc-ADP(faf) (1)
- VERB-Part--NOUN-Acc-ADP(na) (2)
- VERB-Part--NOUN-Acc-ADP(nadól) (1)
- VERB-Part--NOUN-Acc-ADP(paslét) (1)
- VERB-Part--NOUN-Acc-ADP(sas) (1)
- VERB-Part--NOUN-Gen (5)
- VERB-Part--NOUN-Nom (20)
- VERB-Part--PRON (43)
- VERB-Part--PRON-Acc (278)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Fin--NOUN-ADP(nah) (1)
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Acc-ADP(ad) (15)
- VERB-Fin--NOUN-Acc-ADP(at) (5)
- VERB-Fin--NOUN-Acc-ADP(da) (2)
- VERB-Fin--NOUN-Acc-ADP(faf) (10)
- VERB-Fin--NOUN-Acc-ADP(na) (23)
- VERB-Fin--NOUN-Acc-ADP(nah) (2)
- VERB-Fin--NOUN-Acc-ADP(niz) (1)
- VERB-Fin--NOUN-Acc-ADP(pa) (2)
- VERB-Fin--NOUN-Acc-ADP(prez) (4)
- VERB-Fin--NOUN-Acc-ADP(pri) (2)
- VERB-Fin--NOUN-Acc-ADP(sas) (5)
- VERB-Fin--NOUN-Acc-ADP(u) (1)
- VERB-Fin--NOUN-Acc-ADP(varhú) (2)
- VERB-Fin--NOUN-Acc-ADP(vaz) (2)
- VERB-Fin--NOUN-Acc-ADP(za) (7)
- VERB-Fin--NOUN-Gen (39)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--NOUN-Nom-ADP(pa) (1)
- VERB-Fin--NOUN-Voc (2)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (7)
- VERB-Fin--PRON-Acc-ADP(at) (1)
- VERB-Fin--PRON-Acc-ADP(faf) (1)
- VERB-Fin--PRON-Acc-ADP(na) (1)
- VERB-Fin--PRON-Acc-ADP(nah) (2)
- VERB-Fin--PRON-Acc-ADP(pri) (1)
- VERB-Fin--PRON-Acc-ADP(sas) (2)
- VERB-Fin--PRON-Acc-ADP(u) (3)
- VERB-Fin--PRON-Acc-ADP(vaz) (1)
- VERB-Fin--PRON-Acc-ADP(za) (1)
- VERB-Fin--PRON-Gen (303)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Gen (3)
- VERB-Part--NOUN-Acc-ADP(ad) (2)
- VERB-Part--NOUN-Acc-ADP(at) (4)
- VERB-Part--NOUN-Acc-ADP(atpréš) (1)
- VERB-Part--NOUN-Acc-ADP(da) (1)
- VERB-Part--NOUN-Acc-ADP(f) (1)
- VERB-Part--NOUN-Acc-ADP(faf) (23)
- VERB-Part--NOUN-Acc-ADP(méždu) (1)
- VERB-Part--NOUN-Acc-ADP(na) (17)
- VERB-Part--NOUN-Acc-ADP(nah) (5)
- VERB-Part--NOUN-Acc-ADP(pa) (3)
- VERB-Part--NOUN-Acc-ADP(pad) (3)
- VERB-Part--NOUN-Acc-ADP(prez) (1)
- VERB-Part--NOUN-Acc-ADP(pri) (1)
- VERB-Part--NOUN-Acc-ADP(s) (1)
- VERB-Part--NOUN-Acc-ADP(sas) (3)
- VERB-Part--NOUN-Acc-ADP(za) (1)
- VERB-Part--NOUN-Acc-ADP(za)-ADP(nah) (3)
- VERB-Part--NOUN-Acc-ADP(zad) (1)
- VERB-Part--NOUN-Gen (34)
- VERB-Part--NOUN-Gen-ADP(na) (1)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--NOUN-Nom-ADP(na) (1)
- VERB-Part--PRON-Acc-ADP(at) (1)
- VERB-Part--PRON-Acc-ADP(faf) (1)
- VERB-Part--PRON-Acc-ADP(paslét) (1)
- VERB-Part--PRON-Acc-ADP(sas) (1)
- VERB-Part--PRON-Acc-ADP(u) (3)
- VERB-Part--PRON-Acc-ADP(za) (1)
- VERB-Part--PRON-Gen (156)
Reflexive Verbs
- This corpus contains 2 lemmas that occur at least once with an expl:pv child. Examples: svórnom só, vázkačem só
Verbs with Reflexive Core Objects
- This corpus contains 2 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: skrývom sa, sédom nǽ
Relations Overview
- This corpus uses 14 relation subtypes: acl:relcl, advmod:emph, aux:pass, aux:q, compound:redup, csubj:pass, expl:impers, expl:pv, nmod:tmod, nsubj:pass, obl:agent, obl:arg, obl:lmod, obl:tmod
- The following 5 relation types are not used in this corpus at all: cop, clf, list, goeswith, reparandum