UD Moksha JR
Language: Moksha (code: mdf
)
Family: Uralic
This treebank has been part of Universal Dependencies since the UD v2.5 release.
The following people have contributed to making this treebank part of UD: Jack Rueter, Maria Levina, Nadezhda Kabaeva, Judit Molnár, Khalid Alnajjar.
Repository: UD_Moksha-JR
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: nonfiction, news
Questions, comments? General annotation questions (either Moksha-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [rueter • jack (æt) gmail • com]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
Erme Universal Dependencies annotated texts Moksha are the origin of UD_Moksha-JR with annotation (CoNLL-U) for texts in the Moksha language, it originally consists of a sample from a number of fiction authors writing originals in Moksha.
This is a collection of sentences from almost entirely original Moksha-language literary sources dating back to the 1880s with Universal Dependencies (UD) annotations. It has been constructed in alignment with parallel work on Erzya language Universal Dependencies.
There are also about 20 parallel sentences translated by Marina Levina from the Erzya and Russian texts: http://ilazki.thinkgeek.co.uk/brat/#/uralic/myv and http://ilazki.thinkgeek.co.uk/brat/#/uralic/rus
The sent_id attribute value is not randomized in works published earlier than 1938. Developing UD documentation can be found at https://github.com/UniversalDependencies/docs for Erzya.
https://github.com/rueter/erme-ud-moksha
Acknowledgments
The original annotation has been performed by Jack Rueter at the University of Helsinki with the help of Marina Levina at the Mordovian State University im. P.N. Ogariova, Mordvin Languages Department using morphological tools that were originally built with funding from a Kone Foundation «Language Programme» funded project: «Creation of Morphological Parsers for Minority Finno-Ugrian Languages» (2013–2014) with the linguistic work of Merja Salo, and facilitated at the Norwegian Arctic University in Tromsø. Work with the Moksha treebank builds upon previous experience with the UD_Erzya-JR treebank and continued consultations and discussions with Francis Tyers, Tommi Pirinen, Jonathan Washington. Without the Moksha writers themselves, however, we would be no where…
Annotation work is simultaneous to finite-state transducer development by Nadjezhda Kabaeva, Marina Levina and Jack Rueter in the GiellaLT infrastucture, which also works with Constraint Grammar disambiguation of the morphological analysis.
References
If you use this data set in an academic publication, I would be ever so grateful if you cited it as follows:
Jack Rueter. (2018, January 20). Erme UD Moksha (Version v1.0) http://doi.org/10.5281/zenodo.1156112
About the authors
- Кузнецов, Юрий 1975: Сембось ушеткшни киста. Саранск.
- Mishanina, V. I. (Мишанина, В. И.) 1972: Лиендень очконяса. Мокша №3, 38–39. Саранск. (MishaninaValentina_LiendenyOchkonyasa_Moksha-1972-No2-pp38-39) (Мордовиянь Кадошкина аймаконь Адаж веле)
-
- Мокшень кяль. Синтаксис* : учебник / аноклаф-тиф Н. С. Алямкинонь и О. Е. Поляковонь профессорхнень вятемаснон ала. – Саранск : Изд-во Мордов. ун-та, 2008. – 200 с. – На морд.-мокша яз.
- Pyanzin, Fyodor (Пьянзин, Фёдор) 1991: Седить тердеманц коряс: Повесть. – Саранск: Мордов. кн. изд-во, 1991. – 120 с. Мордов.-мокша яз.
In release 2.7 additional example sentences used in the Moksha-language grammar Мокшень кяль, синтаксис: учебник (2008) were included. These sentences are marked with sent_id-s that contain the components MKS:2008:page:n-th sentence:original author
. It is hoped that the inclusion of these sentences will help cover various grammatical phenomena in Moksha syntax. When refering to these sentences, we advise you also cite the original source:
- Алямкин, Н. С. (гл. ред.); Гришунина, В. П.; Иванова, Г. С.; Кабаева, Н. Ф.; Кулакова, Н. А.; Левина, М. З.; Поляков, О. Е. (гл. ред.); Рогожина, В. Ф.; Седова, П. Е. 2008: * Мокшень кяль. Синтаксис : учебник [Moksha language. Syntax: reader]. – Саранск : Изд-во Мордов. ун-та.
- Alâmkin, N. S. (chief ed.); Grushinina, V. P.; Ivanova, G. S.; Kabaeva, N. F.; Kulakova, N. A.; Levina, M. Z.; Polâkov, O. E. (chief ed.); Rogozhina, V. F.; Sedova, P. E. 2008: * Mokshen’ kâl’. Sintaksis: uchebnik [Moksha language. Syntax: reader]. – Saransk : Izd-vo Mordov. un-ta.
- Kehayov, Petar 2020: Between facts and speech acts: The conditional and condictional-conjunctive in Moksha Mordvin. Linguistica Uralica LVI 2020 1 [https://dx.doi.org/10.3176/lu.2020.1.03]
Statistics of UD Moksha JR
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – AdpType – AdvType – Animacy – Aspect – Case – Clitic – Connegative – Definite – Degree – Derivation – Gender – Mood – NameType – Nomzr – NounType – Number – Number[obj] – Number[psor] – Number[subj] – NumForm – NumType – PartForm – Person – Person[obj] – Person[psor] – Person[subj] – Polarity – PronType – PunctSide – Reflex – Style – Tense – Typo – Variant – VerbForm – VerbType
Relations
acl – acl:relcl – advcl – advcl:cau – advcl:eval – advcl:tcl – advmod – advmod:cau – advmod:cmp – advmod:deg – advmod:eval – advmod:foc – advmod:freq – advmod:lmod – advmod:mmod – advmod:tmod – amod – appos – aux – aux:cnd – aux:nec – aux:neg – aux:opt – aux:q – case – cc – cc:preconj – ccomp – compound – compound:nn – conj – cop – csubj – csubj:cop – dep – det – discourse – dislocated – expl – fixed – flat – flat:name – list – mark – nmod – nmod:bahuv – nmod:gobj – nmod:lmod – nmod:poss – nmod:tmod – nsubj – nsubj:cop – nsubj:pass – nummod – obj – obl – obl:agent – obl:cau – obl:cmp – obl:freq – obl:inst – obl:lmod – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 474 sentences, 4347 tokens and 4353 syntactic words.
- This corpus contains 831 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 41 types of words that contain both letters and punctuation. Examples: кати-коста, кодама-кодама, кой-кие, кой-кона, шинек-венек, эрямань-ащемань, 14-це, Алда-баба, Васток-васток, И., Кой-кинди, Коса-бди, Н., Панчк-ка, Пилсесь-лаксесь, Эрясть-ащесть, атят-бабат, видьмода-эрьгада, кати-мезе, кодама-бъди, кой-коста, кядьта-пильгта, лиендихть-тиихть, лийфнесамазь-тисамазь, мезе-бди, мезень-бъди, обедамста-ужнамста, однек-сиренек, ризфсь-пичефкссь, саднек-мезнек, стирьхне-цёратне, тиеда-арада, трнаты-вачкаты, тядяфтома-аляфтома, тяшнесь-нарнесь, фкя-фкянь, шталезе-урядалезе, щафтама-каряфтама, эряй-ащи, ювандема-явондема, ётай-потай
- This corpus contains 3 multi-word tokens. On average, one multi-word token consists of 3.00 syntactic words.
- There are 3 types of multi-word tokens. Examples: ласькозь-ласькихть, эрят-ащат, юмай-арай.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 10 word types tagged as particles (PART): вдь, въдь, дяряй, и, нльне, нльня, сяда, хоть, хуш, шять
- This corpus contains 28 lemmas tagged as pronouns (PRON): иля, кати-мезе, кафонест, кафцьке, ки, кивок, кие, кой-кие, кой-кона, кона, лия, мезе, мезе-бди, мезевок, мон, монць, ня, сембе, сон, сонць, ськамот, ся, сяка, тон, тона, тонць, тя, фкя-фкя
- This corpus contains 17 lemmas tagged as determiners (DET): иля, кафцьке, кодама-бди, кой-кона, лама, лия, мзяра, ня, сембе, сняра, ся, сяка, тя, тяка, тяфтама, эрь, эсь
- Out of the above, 9 lemmas occurred sometimes as PRON and sometimes as DET: иля, кафцьке, кой-кона, лия, ня, сембе, ся, сяка, тя
- This corpus contains 9 lemmas tagged as auxiliaries (AUX): аф, аш, ба, катк, ли, савомс, сашендовомс, улемс, эрявомс
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: савомс, эрявомс
- There are 8 (de)verbal forms:
- Conv
- VERB: вятезь, ласькозь, эцезь, ётазь, Нолдазь, Тумстост, дивандазь, завтракамста, кенордазь, мадомста
- Conv,Part
- AUX: апак
- Fin
- AUX: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- VERB: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- Inf
- VERB: стямс, тиемс, тонафтомс, ётамс, куцема, работама, Валдашкодомс, аделамс, анцемс, арамс
- NomAg
- VERB: ётафтысь
- Part
- VERB: мяляфтан, Кундафнень, Содаф, анеляф, ацафоль, ащи, иретьфти, лиенди, максф, маскировандафт
- Sup
- VERB: путькияма
- Vnoun
- VERB: Авардемать, Нумань, апрякама, ардомась, варьхмодема, видемда, кельгомнян, кенярдема, куломозон, ляцендемат
Nominal Features
- Fem
- PROPN: Петровна, Варвара, Васильевна, Ивановать, Людмила, Николаевнань, Светлана
- Masc
- PROPN: Вельдинонь, Голенков, Девинонь, Девятаев, Злобинонь, Келаськин, Кокоревонь, Кукушкинць, Михаил, Петр
- Hum
- NOUN: тядяц
- PRON: Кинди
- PROPN: Петровна, Варвара, Васильевичекс, Васильевна, Вельдинонь, Голенков, Девинонь, Девятаев, Елена, Злобинонь
- Plur
- ADJ: мазыхть, весялат, лямбот, малат, пяндрат, ёнюфт
- DET: ня
- NOUN: ломаттне, стирнятне, валхнень, ломатть, гулянятнень, досканят, жаворонкатне, кизотнень, коволнятнень, морот
- NUM: Кафттне, кемотть
- PRON: синь, минь, тейст, Лиятнень, кафонест, конат, синьге, сятка, теест, тейнть
- VERB: Кундафнень, Лядыхне, кельгихть, ляцендемат, маскировандафт, мярьгихть, путфт, сялондыхнень, шапфт, шнакшнематне
- VERB-Part: Кундафнень, маскировандафт, путфт, шапфт
- VERB-Vnoun: ляцендемат, шнакшнематне
- Plur,Sing
- ADJ: Ёмластокиге, Мокшень, Немойкс, аноконди, маластонь, оцюняснон, пародонга, роднойкс
- ADV: ламос, сяшкава
- DET: ламос
- NOUN: лангс, паксянь, каршес, сёксень, вирьса, кудса, лангса, ульцяв, ярмакса, Марянь
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: сембонь, Мезень, конань, мезенкса, Кой-кинди, Конашка, Мезьда, илянь, кинди, киньге
- PROPN: Архипонь, Валентинонди, Ванянди, Васильевичекс, Вельдинонь, Веряскинонди, Витянь, Девинонь, Злобинонь, Кокоревонь
- VERB: мяляфтан, Нумань, видемда, куломозон, морамаснон, мяляфтат, покодемаснон, работаманкса, саманьконь, самозост
- VERB-Part: мяляфтан, мяляфтат, сюдофокс, юкстафокс
- VERB-Vnoun: Нумань, видемда, куломозон, морамаснон, покодемаснон, работаманкса, саманьконь, самозост, сяськоманкса, тумозонза
- Sing
- ADJ: оцю, од, тяфтама, мазы, пара, сире, цебярь, акша, кодама, козя
- DET: эрь, лама, сембе, Тя, ся, иля, кодама-бъди, кой-кона, лия, тяка
- NOUN: шись, пингть, ава, Тишка, ланга, ломань, пря, цёранц, шамац, шиня
- NUM: кафта, фкя, колма, 225, 7, вете, колмоцьке, комсь, ниле
- PRON: сон, мон, тя, сонь, ся, тон, мезевок, монь, тейнза, тейть
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара
- VERB: Авардемать, Содаф, азовомшка, анеляф, аноклайхть, аноклама, апрякама, ардомась, варьхмодема, кельгомнян
- VERB-Fin: туват
- VERB-NomAg: ётафтысь
- VERB-Part: Содаф, анеляф, максф, пидефонц, праф, сафат, сивотьф, содафоль, тертьфоль, тиф
- VERB-Sup: путькияма
- VERB-Vnoun: Авардемать, апрякама, ардомась, варьхмодема, кельгомнян, кенярдема, муськома, работамась, саманцты, сувамац
- Abe
- NOUN: лемфтома, перилафтома, эрьгяфтома
- Abl
- ADJ: пародонга
- ADP: эзда, фталда, ширде, эздон, эздонк, эздост
- ADV: вярде, ичкозде
- NOUN: ломаньда, ширде, Аннада, Пиледот, алда, алядот, вайгяльда, врьгазда, занятияда, иможда
- PRON: Мезьда, Тяда, мондедон, сембода
- VERB-Inf: валдашкодомда, ванфтомода, видемда, корхтамда, крфамда, лездомда, тиемда, шашнемда, якамда
- VERB-Part: мяляфтан, мяляфтат
- VERB-Vnoun: видемда, ужнамда
- Cau
- ADP: инкса
- ADV: тянкса
- NOUN: лезксонкса
- PRON: мезенкса
- VERB-Vnoun: работаманкса, сяськоманкса
- Cmp
- ADP: эшка
- NOUN: пялешка, сурбряшка
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: Конашка
- Com
- NOUN: шинек-венек, куднек, саднек-мезнек, ульцянек
- Dat
- ADJ: аноконди
- NOUN: Алязтиге, Дарюняти, Кенкшти, Кепотьксонди, Кинди, Луканди, Маринкати, Цёранянди, Ялгати, авардематненди
- PRON: тейнза, тейть, Тейне, кинди, теень, тейст, Кой-кинди, Мондейне, Сондеенза, Сондейнза
- PROPN: Валентинонди, Ванянди, Веряскинонди, Петровиченди
- VERB-Vnoun: саманцты, цяпамати
- Ela
- ADJ: Ёмластокиге, маластонь
- ADP: пингста, ваксста
- ADV: тоста, Тяста, кати-коста, кой-коста, курокста, эста, коста, тяза
- NOUN: велеста, комнатаста, кудста, онцтон, пингста, пингстонза, ёткста, Вирьста, Москуста, базарста
- VERB: лисемста, самста, Тумстост, завтракамста, мадомста, обедамста-ужнамста
- VERB-Conv: Тумстост, завтракамста, мадомста, обедамста-ужнамста
- Gen
- ADJ: Очижинь, омбоцеть, тячиень, Мокшень, Передовойть, главнайть, моронц, оцюняснон
- ADV: кафтонь
- NOUN: пингть, паксянь, сёксень, цёранц, шить, валхнень, велеть, менельть, мирденц, очконять
- PRON: сонь, монь, сембонь, тонь, синь, тянь, минь, Мезень, конань, Лиятнень
- PROPN: Архипонь, Вельдинонь, Витянь, Девинонь, Злобинонь, Ивановать, Кокоревонь, Мокшеть, Николаевнань, Пашуть
- VERB: Авардемать, Кундафнень, Нумань, аноклайхть, морамаснон, пидефонц, покодемаснон, саманьконь, сялондыхнень, тушендомаснон
- VERB-Part: Кундафнень, пидефонц
- VERB-Vnoun: Авардемать, Нумань, морамаснон, покодемаснон, саманьконь, тушендомаснон, эводемать, эрямань-ащемань
- Ill
- ADP: лангс, ваксс, коряс, малас, Корязост, корязон, корязонк, корязонт, эзонза
- ADV: Коза, ламос, Мес, козовок, тяза
- DET: ламос
- NOUN: лангс, каршес, вастс, кучкас, лангозонза, вастозонза, вельхксс, воляс, кудрядс, лафтубрязонза
- PRON: эсезост
- VERB-Vnoun: куломозон, самозост, тумозонза
- Ine
- ADP: эса, ваксса, лангса, каршесонк, эсовок, эсонза, эсост
- ADV: тоса, тяса, коса, маласа, Коса-бди, косовок, пяшксетольхть
- NOUN: вирьса, кудса, лангса, ярмакса, больницяса, вайгяльса, войнаса, кизоса, мяльса, тюсса
- PRON: мезьса
- PROPN: Парижса
- Lat
- ADP: алу, шири
- ADV: вяри, алу, ичкози, оду, фталу, меки
- NOUN: инголи, ульцяв, куду, паксяв, шири, школав, Колхозу, Крыму, Мазы, Маманяв
- Loc
- ADP: ала, Инголенк, Инголест, пильгалот
- ADV: ичкозе, инголе, перьфпяле, ичкозят
- AUX: аш
- VERB-Inf: куцема, работама, шурокстомома, азонкшнема, ванондома, ватксема, вятемонза, лувома, морама, мярьгома
- VERB-Vnoun: апрякама
- Nom
- ADJ: оцю, од, тяфтама, мазы, пара, сире, цебярь, акша, кодама, козя
- DET: эрь, лама, сембе, Тя, ся, иля, кодама-бъди, кой-кона, лия, тяка
- NOUN: ломаттне, шись, ава, Тишка, ланга, ломань, пря, стирнятне, шамац, визькс
- NUM: кафта, фкя, колма, 225, 7, Кафттне, вете, кемотть, колмоцьке, комсь
- PRON: сон, мон, тя, ся, тон, синь, мезевок, минь, кона, мезе
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара
- VERB: Лядыхне, Содаф, азовомшка, анеляф, аноклама, ардомась, варьхмодема, кельгихть, кельгомнян, кенерь
- VERB-Fin: туват
- VERB-NomAg: ётафтысь
- VERB-Part: Содаф, анеляф, максф, маскировандафт, праф, путфт, сафат, сивотьф, содафоль, тертьфоль
- VERB-Sup: путькияма
- VERB-Vnoun: ардомась, варьхмодема, кельгомнян, кенярдема, ляцендемат, муськома, работамась, сувамац, тиемацка, шнакшнематне
- Prl
- ADP: мельгя, эзга, Мельгат, лангаст, мельге
- ADV: перьфпяльге, Шобдава, сяшкава
- NOUN: вальмава, морява, пандонява, алга, вастоваст, ведьгя, велькска, вельхкска, вирьгя, вярьгя
- Tem
- NOUN: шиня, Пиземня
- Tra
- ADJ: Немойкс, роднойкс
- ADP: ланга
- NOUN: сторожкс, геройкс, депутатокс, июленнекс, кизоннекс, комендантокс, крайкс, лётчикокс, лётчикокска, мокшекс
- PROPN: Васильевичекс
- VERB: сюдофокс, юкставикс, юкстафокс
- VERB-Part: сюдофокс, юкстафокс
- Def
- ADJ: омбоцеть, Передовойть, главнайть, колмоцесь, коськсь
- NOUN: ломаттне, шись, пингть, стирнятне, шить, валхнень, велеть, колхозсь, менельть, очконять
- NUM: Кафттне
- PRON: Лиятнень, Сембось
- PROPN: Васясь, Ивановать, Игуазсь, Кукушкинць, Маринкась, Марясь, Млай, Мокшеть, Парижсь, Пашуть
- VERB: Авардемать, Кундафнень, Лядыхне, аноклайхть, ардомась, работамась, сетьмось, сялондыхнень, цяпамати, шнакшнематне
- VERB-NomAg: ётафтысь
- VERB-Part: Кундафнень
- VERB-Vnoun: Авардемать, ардомась, работамась, цяпамати, шнакшнематне, эводемать
- Ind
- ADJ: оцю, од, тяфтама, мазы, пара, сире, акша, кодама, козя, пси
- ADV: кати-коста, ламос, Коса-бди, кафтонь, козовок, косовок, сяшкава
- DET: эрь, лама, сембе, кодама-бъди, кой-кона, ламос, лия, тяка, тяфтама, эсь
- NOUN: лангс, ава, паксянь, шиня, Тишка, каршес, ланга, ломань, пря, сёксень
- NUM: кафта, фкя, колма, вете, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- PRON: тя, ся, сембонь, кона, мезевок, тянь, конань, сяка, Конашка, Сянь
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Архипонь, Браун
- VERB: мяляфтан, Нумань, Содаф, азовомшка, анеляф, аноклама, апрякама, варьхмодема, видемда, кельгихть
- VERB-Fin: туват
- VERB-Part: мяляфтан, Содаф, анеляф, максф, маскировандафт, мяляфтат, праф, путфт, сафат, сивотьф
- VERB-Sup: путькияма
- VERB-Vnoun: Нумань, апрякама, варьхмодема, видемда, кельгомнян, кенярдема, ляцендемат, муськома, работаманкса, сяськоманкса
Degree and Polarity
- Cmp
- PART: сяда
- Dim
- ADV: аруняста, саворне
- NOUN: карденя, очконять, досканят, коволнятнень, ловнясь, пацяняц, стирнятне, Бабанять, Лефкскятнень, Луганятне
- VERB-Vnoun: кельгомнян
- Sup
- ADV: Сембода
- Neg
- ADV: аш
- AUX: аф, ашезь, апак, ашень, ашеть, изь, афоль, аш, ашесть, тяк
- AUX-Conv,Part: апак
- AUX-Fin: ашень, ашезе
- INTJ: аф
- Long
- PRON: Мондейне, Сондеенза, Сондейнза, тондейть
- Short
- PRON: тейнза, тейть, Тейне, теень, тейст, теенза, теест, тейнть, эсезост
Verbal Features
- Hab
- VERB-Fin: каннель, лезнель
- Perf
- VERB-Part: анеляф, максф, содафоль, таргозьфтольхть, тиф, шапфт, эйндаф
- Des
- VERB: Молелексолеть
- Imp
- AUX: тяк, Тят
- VERB: архт, ярхцада, Лувонтт, Эрясть-ащесть, катк, кевонзасть, кизефнек, моледа, сувак, тиеда-арада
- Ind
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, ба, ули
- AUX-Fin: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- VERB: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- Nec
- VERB: улема
- NegCndSub
- AUX: улефтяряль
- Opt
- AUX: катк, савоза
- VERB: кирдест, ванозазе, шачфтозан
- Prec
- AUX: тята
- VERB: Варжалите, Панчк-ка, варжака
- Sub
- AUX: афоль, ба, Улендяряль, афолензе, афолеть, улелеть
- VERB: Видендярялеть, Лездолень, Путондяряльхть, Рамаль, Сандяряль, Таргафтолемайть, арьселень, келептелине, корхнельхть, курендакшнельхть
- Past
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, Улень, ашезе
- AUX-Fin: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась, кармасть
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- VERB-Part: Содаф, ацафоль, пидефонц, сивотьф, содафоль, таргозьфтольхть, тертьфоль
- Pres
- ADJ: Валдонян, Тяконян, Шумбрат
- ADV: ичкозят
- AUX: аш, эряви, Эрявихть, сашендови, ули, улян
- AUX-Fin: ули, эряви
- NOUN: Маконян, ават, алят, прясан
- PROPN: Алдуван
- VERB: моли, ащи, касан, корхтай, симат, эрят, Арьсян, Корхтайхть, ванан, корхтан
- VERB-Fin: корхтан, лиси, моли, мярьгат, пели, содасак, тиян, туян, эрявихть, эряйхть
- VERB-Part: мяляфтан, ащи, иретьфти, лиенди, моли, мяляфтат, сай, сафат, ётай-потай
- VERB-Vnoun: кельгомнян
Pronouns, Determiners, Quantifiers
- Dem
- ADJ: тяфтама
- ADV: тяза
- DET: ня, Тя, ся, тяка, тяфтама
- PRON: тя, ся, тянь, Сянь, Тяда, сятка, тона
- Ind
- ADV: коданга, козонга
- DET: кодама-бъди
- PRON: мезевок, кивок, кой-кие, Кой-кинди, кати-мезе, киньге, кой-кона, мезе-бди, мезень-бъди
- Int
- ADJ: кодама
- ADV: Мес, коста
- DET: Мъзяра
- PRON: кие, кинди, мезе, Мезень, мезьса
- Prs
- PRON: сон, мон, сонь, синь, минь, тон, монь, тейнза, тейть, тонь
- Rcp
- PRON: фкя-фкянь
- Rel
- PRON: кона, конань, конат
- Tot
- DET: кафцьке
- PRON: кафонест, кафцьке
- Card
- ADV: кафтонь
- NUM: фкя, кафта, колма, вете, Кафттне, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- Coll
- NUM: колмоцьке
- Dist
- ADJ: кодама-кодама
- Mult
- ADV: весть
- Ord
- ADJ: васенце, омбоце, омбоцеть, 14-це, Нильгемонце, ветеце, кемонце, колмоце, колмоцесь, сизьгемонце
- Sets
- DET: кафцьке
- NOUN: шинек-венек
- NUM: кафонц
- PRON: кафонест, кафцьке
- Yes
- DET: эсь
- PRON: монць, сонць, сонцьке, тонцьке, эсезост
- 1
- PRON: мон, минь, монь, Тейне, монць, теень, Мондейне, мондедон, моньге
- 2
- PRON: тон, тейть, тонь, тейнть, тинь, тонга, тондейть, тонцьке
- 3
- PRON: сон, сонь, синь, тейнза, сонць, тейст, Сондеенза, Сондейнза, кафонест, синьге
- Plur
- ADJ: оцюняснон
- ADP: корязост, Инголенк, Инголест, каршесонк, корязонк, корязонт, лангаст, эздонк, эздост, эсост
- NOUN: сельмосна, Казарманьконь, Мотоциклантень, бабасновок, ваймоньконь, валсна, вастоваст, веленьконь, велесонк, дружбаснон
- VERB-Conv: Тумстост
- VERB-Vnoun: морамаснон, покодемаснон, саманьконь, самозост, тушендомаснон
- Sing
- ADJ: Нильгемонце, моронц
- ADP: мархтонза, Мельгат, корязон, перьфканза, пильгалот, эздон, эзонза, эсонза
- NOUN: цёранц, шамац, мирденц, мялец, мяльце, Алязе, брадозень, вазенц, лангозонза, мялецоль
- PRON: ськамот
- PROPN: Мишазе
- VERB-Inf: вятемонза, учендомот, шнамонза
- VERB-Part: пидефонц
- VERB-Vnoun: куломозон, саманцты, сувамац, тиемацка, тумозонза
Other Features
- Abbr
- Yes
- NOUN: И., Н.
- Yes
- AdpType
- Post
- ADP: мархта, колга, пачк, сюнеда, Мельгат, инкса, лангаст, мельге, пильгалот, фталда
- Post
- AdvType
- Deg
- ADV: пяк, сяда, сяшкава, конашкава, тяшкава, ёфcи, ёфси
- Loc
- ADV: тов, алу, меки, тяза
- Man
- ADV: цебярьста, мазыста, Кода, Тяфта, весяласта, вишкста, павазуста, хитрайста, цебярняста
- Mod
- ADV: бта, пади, Стаки
- Sta
- ADV: кяпе
- Tim
- ADV: нинге, ни, эста, тага, кунара, меле, рана, Кизонда, илять, тяни
- NOUN: илять
- SCONJ: мъзярда
- Deg
- Clitic
- Add
- ADP: эсовок
- NOUN: алтарьсонга, ульмоняцевок
- PRON: мезевок
- AddGA
- ADV: вестенге
- NOUN: Алязтиге, ведняське, лётчикокска, мялезостка, школавга
- PRON: моньге, синьге, сонцьке, сятка, тонга, тонцьке
- VERB-Vnoun: тиемацка
- AddKige
- ADJ: Ёмластокиге
- ADV: ранакиге
- AddNgA
- ADJ: пародонга
- ADV: сядонга
- AddVok
- NOUN: бабасновок, самолётовок
- VERB-Fin: поладывок
- I
- ADV: Сясы
- AUX: Афи
- SCONJ: Сясы
- Add
- Connegative
- Yes
- VERB: кирде, матодов, Маряк, абонда, ана, атказа, ваймак, виде, кадонда, карма
- Yes
- Derivation
- Cond
- AUX: ба, Улендяряль, савондяряй
- VERB: Касондярян, матодовондяряй, Видендярялеть, Путондяряльхть, Сандяряль, кадондярясак, кизефтендярясамазь, кирдендярясы, лездондярятада, лисендяряль
- F
- VERB-Part: анеляф, ацафоль, максф, маскировандафт, путфт, ранендаф, содафоль, таргозьфтольхть, тиф, шавф
- GenAttr
- ADJ: озадонь, маластонь
- OvOms
- VERB: азовомшка, вачкодеви, марявсь, шавовсь, шятяват
- Ozj
- VERB-Conv: ётазь, Нолдазь, дивандазь, кенордазь, палозь, путозь, учсезь
- Poss
- NOUN: вальмялангоннесь, зрняннеть, июленнекс, кизоннекс, сияннеть
- Voc
- NOUN: бабай, Тядяй, атяй, кельгомняй
- Wife
- PROPN: Цямкаерясь
- Cond
- NameType
- Geo
- PROPN: Игуазсь, Парижса, Парижсь, Франциять
- Giv
- PROPN: Петя, Марья, Алда-баба, Анна, Архипонь, Ванянди, Варвара, Василь, Васясь, Володя
- Pat
- PROPN: Петровна, Васильевич, Васильевна, Михайлович, Светлана, Степанович
- Sur
- NOUN: Канайкинонь, Ленинонь, Мазы, Малининонь, Тумкин
- PROPN: Браун, Вельдинонь, Вельматов, Веряскинонди, Голенков, Девинонь, Девятаев, Злобинонь, Ивановать, Каргалов
- Geo
- Nomzr
- Ag
- VERB: Лядыхне, аноклайхть, кельгихть, мярьгихть, сялондыхнень, эряскодыхть
- Ag
- NounType
- Relat
- ADP: лангс, ланга
- NOUN: лангс, каршес, ланга, лангса, кучкас, лангозонза, шири, ёткста, Лангсонза, алга
- Relat
- NumForm
- Digit
- ADJ: 14-це
- NUM: 225, 7
- Digit
- Number[obj]
- Plur
- VERB: Кельгсайне, Лихтезь, Эрясть-ащесть, азозь, азондозень, азондыне, азыне, аноклазень, вадердасыне, ванфнезь
- VERB-Fin: Кельгсайне, азозь, аноклазень, вадердасыне, ванфнезь, васьфтьсамазь, кепсезь, крьвястезень, лемдеськ, нолязень
- Plur,Sing
- VERB: Кончайне
- Sing
- AUX: тяк, афолензе, ашезе
- AUX-Fin: ашезе
- VERB: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Ладяйне, Няить, Таргафтолемайть
- VERB-Fin: валхтозе, кизефтезе, содасак, вархцодезе, дивандафтомань, кадозе, каязе, каяфтозе, кельксезе, кеподьсы
- Plur
- Number[subj]
- Plur
- ADV: пяшксетольхть
- AUX: ульсть, ашесть, Эрявихть, ашельхть, исть, эрявсть
- AUX-Fin: ульсть
- VERB: кармасть, морасть, Корхтайхть, кирдест, лиссть, работасть, тисть, уендихть, эрявихть, эряйхть
- VERB-Fin: кармасть, морасть, работасть, эрявихть, эряйхть, Ушедоме, азозь, ардоме, ащесть, ванфнезь
- VERB-Part: таргозьфтольхть
- Sing
- ADJ: маниель, Валдонян, Муворуван, Тяконян, Шумбрат, акшель, лямболь, пароль, сятяволь, цебярель
- ADV: ичкозят
- AUX: ульсь, ашезь, ашень, ашеть, изь, эрявсь, афоль, аш, тяк, тят
- AUX-Fin: ашень, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- NOUN: мялецоль, Маконян, ават, алят, порядкасоль, прясан
- PROPN: Алдуван
- VERB: архт, марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь
- VERB-Fin: кармась, арась, марявсь, сась, сувась, тусь, утцесь, ушедсь, ётась, аськолясь
- VERB-Part: мяляфтан, ацафоль, мяляфтат, сафат, содафоль, тертьфоль
- VERB-Vnoun: кельгомнян
- Plur
- PartForm
- NegConvPrc
- AUX-Conv,Part: апак
- Past
- VERB-Part: мяляфтан, Кундафнень, мяляфтат, праф, сафат, сюдофокс, эцеф, юкстафокс
- NegConvPrc
- Person[obj]
- 1
- VERB: Таргафтолемайть, валхтсамазь, васьфтьсамазь, дивандафтомань, кизефтендярясамазь, лийфнесамазь-тисамазь, няйсамак, няйсамасть, пиксомань, шачфтомань
- VERB-Fin: васьфтьсамазь, дивандафтомань, лийфнесамазь-тисамазь, няйсамак, няйсамасть
- 2
- AUX: афолензе
- VERB: стардондярятанза
- 3
- AUX: тяк, ашезе
- AUX-Fin: ашезе
- VERB: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Кельгсайне, Кончайне, Ладяйне
- VERB-Fin: валхтозе, кизефтезе, содасак, Кельгсайне, азозь, аноклазень, вадердасыне, ванфнезь, вархцодезе, кадозе
- 1
- Person[psor]
- 1
- ADP: Инголенк, каршесонк, корязон, корязонк, эздон, эздонк
- NOUN: Алязе, брадозень, онцтон, сельмонень, шиня, Алязтиге, Казарманьконь, алязень, арьсеманень, атязе
- PROPN: Мишазе
- VERB-Vnoun: куломозон, саманьконь
- 2
- ADJ: Нильгемонце
- ADP: Мельгат, корязонт, пильгалот
- NOUN: мяльце, Кяльцень, Мотоциклантень, Пиледот, Ялгацень, алядот, ваксстот, кигат, кице, пряцень
- PRON: ськамот
- VERB-Inf: учендомот
- 3
- ADJ: моронц, оцюняснон
- ADP: мархтонза, корязост, Инголест, лангаст, перьфканза, эздост, эзонза, эсонза, эсост
- NOUN: цёранц, шамац, мирденц, мялец, вазенц, лангозонза, мялецоль, пацяняц, пингстонза, сельмосна
- VERB-Conv: Тумстост
- VERB-Inf: вятемонза, шнамонза
- VERB-Part: пидефонц
- VERB-Vnoun: морамаснон, покодемаснон, саманцты, самозост, сувамац, тиемацка, тумозонза, тушендомаснон
- 1
- Person[subj]
- 1
- ADJ: Валдонян, Муворуван, Тяконян
- AUX: ашень, Улень, тят, улян
- AUX-Fin: ашень, Улень
- NOUN: Маконян, прясан
- PROPN: Алдуван
- VERB: касан, Арьсян, Касондярян, ванан, корхтан, мяляфтан, сявонь, тиень, тиян, тунь
- VERB-Fin: корхтан, тиян, туян, Аськолянь, Кельгсайне, Удан, Ушедоме, ардоме, ванан, виздеме
- VERB-Part: мяляфтан
- VERB-Vnoun: кельгомнян
- 2
- ADJ: Шумбрат
- ADV: ичкозят
- AUX: ашеть, тяк, Тят, афолеть, тята, улелеть
- NOUN: ават, алят
- VERB: архт, симат, эрят, мярьгат, сать, содасак, тарат, якат, ярхцада, ёрат
- VERB-Fin: мярьгат, сать, содасак, ёрат, азондат, арать, ащат, каят, кизефнят, корхтазеват
- VERB-Part: мяляфтат, сафат
- 3
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, изь, ульсть, эрявсь, афоль, аш, ашесть, ули, эряви
- AUX-Fin: ульсть, ульсь, ашезе, савсь, сашендовсь, ули, эряви
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, улема
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- VERB-Part: ацафоль, содафоль, таргозьфтольхть, тертьфоль
- 1
- PunctSide
- Fin
- PUNCT: »
- Ini
- PUNCT: «
- Fin
- Style
- Ped
- ADV: кържа, Мзярда
- DET: Мъзяра, кодама-бъди
- PART: въдь
- PRON: мезень-бъди
- SCONJ: къда, мъзярда
- Ped
- Typo
- Yes
- NOUN: карденя, велькска, карденяв
- Yes
- VerbType
- Aux
- ADV: аш
- AUX: аф, ашезь, ба, ашеть, изь, аш, ашесть, тяк, Афоль, Тят
- Aux
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: улемс, аш.
- This corpus uses 5 lemmas as auxiliaries (aux). Examples: аф, аш, улемс, савомс, сашендовомс.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (2)
- VERB--NOUN-Gen (1)
- VERB--NOUN-Nom (89)
- VERB--PRON (1)
- VERB--PRON-Nom (47)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Nom (113)
- VERB-Fin--NOUN-Nom-ADP(мархта) (1)
- VERB-Fin--PRON-Nom (31)
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--NOUN-Nom (4)
- VERB-Part--PRON-Nom (1)
- obj
- VERB--NOUN-Abl (1)
- VERB--NOUN-Ela (1)
- VERB--NOUN-Gen (43)
- VERB--NOUN-Gen-ADP(эшка) (1)
- VERB--NOUN-Ine (1)
- VERB--NOUN-Nom (35)
- VERB--PRON-Gen (3)
- VERB--PRON-Nom (3)
- VERB-Conv--NOUN-Gen (3)
- VERB-Fin--NOUN-Gen (31)
- VERB-Fin--NOUN-Nom (26)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Nom (8)
- VERB-Inf--PRON-Gen (3)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--PRON-Nom (1)
Relations Overview
- This corpus uses 36 relation subtypes: acl:relcl, advcl:cau, advcl:eval, advcl:tcl, advmod:cau, advmod:cmp, advmod:deg, advmod:eval, advmod:foc, advmod:freq, advmod:lmod, advmod:mmod, advmod:tmod, aux:cnd, aux:nec, aux:neg, aux:opt, aux:q, cc:preconj, compound:nn, csubj:cop, flat:name, nmod:bahuv, nmod:gobj, nmod:lmod, nmod:poss, nmod:tmod, nsubj:cop, nsubj:pass, obl:agent, obl:cau, obl:cmp, obl:freq, obl:inst, obl:lmod, obl:tmod
- The following 4 relation types are not used in this corpus at all: iobj, clf, goeswith, reparandum