UD Livvi KKPP
Language: Livvi (code: olo
)
Family: Uralic
This treebank has been part of Universal Dependencies since the UD v2.5 release.
The following people have contributed to making this treebank part of UD: Tommi A Pirinen.
Repository: UD_Livvi-KKPP
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: nonfiction, news, web
Questions, comments? General annotation questions (either Livvi-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [tommi • antero • pirinen (æt) uni-hamburg • de]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | not available |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
UD Livvi-KKPP is a manually annotated new corpus of Livvi-Karelian made directly in the Universal dependencies annotation scheme. The data is collected from VepKar corpora and consists of mostly modern news texts but also some stories and educational texts.
UD Karelian-KKPP is a manually annotated new corpus of Livvi-Karelian made in Universal dependencies annotation scheme. The data is collected from VepKar corpora and consists of mostly modern news texts but also some stories and educational texts. We have based many decisions in the dependency annotations on pre-existing Finnish treebanks. The morphological annotations and grammar are based on the refered books (Markianova, Ahtia) and the Karelian dictionary, with necessary orthographical modernisations.
Acknowledgments
The Livvi (Olonets-Karelian) transducer used in the automated annotation was originally built with funding from Kone Foundation «Language Programme» in Creation of Morphological Parsers for Minority Finno-Ugrian Languages. Rueter, J., Salo, M., Rantakaulio, T., Kuprina, J., Blumberga, R. & Soosaar, S. (01/01/2013–31/12/2014), Where Timo Rantakaulio and Jelena Ruppijeva both worked with description and evaluation. Jelena Ruppijeva translated 19 sentences from the Finnish text in http://ilazki.thinkgeek.co.uk/brat/#/uralic/fin, these can be found in the training set.
Statistics of UD Livvi KKPP
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
AdpType – Case – Clitic – Connegative – Degree – Foreign – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – PronType – Reflex – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:nn – conj – cop – cop:own – csubj:cop – det – discourse – fixed – flat:foreign – flat:name – goeswith – mark – nmod – nmod:poss – nsubj – nsubj:cop – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp – xcomp:ds
Tokenization and Word Segmentation
- This corpus contains 125 sentences and 1632 tokens.
- This corpus contains 441 tokens (27%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 28 types of words that contain both letters and punctuation. Examples: bobuli-briha, -liitto, Ven’al, d’engaa, kul’tuurutalois, -karjalan, -lehti, -videos’užietoin, 97-vuozipäiviä, Istoki-joukko, Lihoslavl’an, Periodika-julguamo, Toive-ansambli, ad’voihkäyndy, bes’odale, d’o, d’äi, ezi-ižien, kul’tuuran, kul’tuuratalois, kul’tuurois, kul’tuuru, kul’tuuruseurah, n’evvoo, pajo-, pyhäil’l’anjyryy, svuad’bas, Čičiliušku-t
Morphology
Tags
- This corpus uses 14 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: DET, PART, SYM
- This corpus contains 24 lemmas tagged as pronouns (PRON): Minun, hyö, häi, iče, kai, ken, kudai, kus, mi, midä, minä, mondu, myö, net, nimidä, nämmä, se, sidä, sinne, sinun, sinä, sit, toine, tämä
- This corpus contains 0 lemmas tagged as determiners (DET):
- This corpus contains 6 lemmas tagged as auxiliaries (AUX): ei, olla, pidiä, rotie, suaha, voija
- Out of the above, 4 lemmas occurred sometimes as AUX and sometimes as VERB: olla, pidiä, suaha, voija
- There are 4 (de)verbal forms:
- Fin
- AUX: oli, on, ollah, voibi, ole, olen, Ongo, olis, pidänyh, voidas
- NOUN: sualis
- VERB: sanoi, rodieu, sanoo, kuulimo, kuulittogo, pietäh, sanottih, tiezimö, tiezittö, istui
- Ger
- AUX: olles
- VERB: Tansijes, mennes, pajattajes, pannes, kuunneltes
- Inf
- AUX: pidää
- VERB: lähtie, ostua, sanuo, arbaittua, arbuamah, arvata, avvuttua, ellendämäh, heittiä, kuundelemah
- Part
- AUX: suannuh
- VERB: käynnyh, mennyt, tundiettu, järjestäjänny, kehitynnyh, koskijoi, mainittuloin, sanottuu, tulluot
Nominal Features
- Plur
- ADJ: Karjalazet, kielitiijollizii, omis, tverinkarjalazien, Erähil, Myöhembäite, Tundemattominnu, Tämänpäiväzile, Vepsäläzet, enimilleh
- AUX: ollah, ei, emmogo, voidas, voidu
- AUX-Fin: ollah, voidas
- CCONJ: eigo
- NOUN: vojennoit, arbaituksii, festivualin, tverinkarjalazien, arbaitukset, lapset, saldatat, sarvet, tekstois, arbaituksien
- NUM: kaksi, kolmet
- PRON: hyö, net, sidä, Heil, Minun, Niilöin, heidy, kai, kudamat, kuduat
- PROPN: Petroskois, Petroskoispäi
- VERB-Fin: kuulimo, kuulittogo, sanottih, tiezimö, tiezittö, lähtiettih, näimö, saneltih, torvittih, avvutetah
- VERB-Part: koskijoi, mainittuloin, tulluot
- X: d’engaa, puččii
- Sing
- ADJ: mustal, valgiel, Toine, bohattu, hyväs, jygei, semmostu, suuri, 30., Arbuamatoi
- ADP: hyväkse
- AUX: oli, ei, on, voibi, olen, En, Ongo, suannuh, voinoo, voit
- AUX-Fin: oli, on, voibi, olen, Ongo, voinoo, voit
- AUX-Part: suannuh
- NOUN: virstaa, saari, bobuli-briha, briha, piduhuttu, saaraa, taatto, Arbaituksen, bohattu, häkki
- NOUN-Fin: sualis
- NUM: kolme, seičče, 2010-2014, 2017, kaksi, kolmas, yksi
- PRON: häi, tämän, se, toine, minun, minul, midä, toizel, toizen, tämä
- PROPN: Tverin, Karjalan, Anuksen, Mustonen, Peter, Petroskoin, Suomes, Anuksenlinnas, Karjalah, Karjalas
- VERB: sanoi, rodieu, sanoo, istui, kraassi, kyzyy, menöö, olen, oli, on
- VERB-Fin: sanoi, rodieu, sanoo, istui, kraassi, kyzyy, menöö, olen, oli, on
- VERB-Part: järjestäjänny, kehitynnyh, sanottuu, tundiettu
- X: piduhuttu
- Abe
- PRON: Minun, sidä, sinun
- Abl
- ADJ: kanzallizil
- NOUN: silmäl
- PRON: Hänel
- Acc
- ADJ: Enzimäine, Oma, Vepsäläzet, jälgimäine, kuulujat, pieni, suuri, uuzi
- NOUN: kilbu, koin, mua, -lehti, Bobuli-briha, Istoki-joukko, Murginan, aijan, aktivistat, bronzumedalin
- PRON: toizen
- VERB-Part: tulluot
- Ade
- ADJ: mustal, valgiel, Erähil, uvvel
- NOUN: kraaskal, sarvel, Karjalazil, Konsertal, festivualil, jengal, kanzoil, kezäkuul, kezäl, kielil
- PRON: minul, toizel, sie, sil
- PROPN: Ven’al, Kotkatjärvel
- All
- ADJ: Tavallizele, Tämänpäiväzile, enimilleh
- NOUN: saaril, saarilloo, bes’odale, dovarišalles, lapsile, ristikanzale
- PRON: Heil, hänele, sinne
- PROPN: Kotkatjärvele
- Com
- NOUN: nuorižonke
- Ela
- ADJ: omis, sigäläzes, viluhkos
- NOUN: kul’tuurutalois, Jovensuus, Karjalazisgi, Vuvves, kieles, kul’tuurois, kyläs, pertispäi, piiris, projektois
- PROPN: Anuksenlinnas, Helsinkis, Karjalas, Kiihtelysvuaraspäi, Koveris, Kuittizes, Kuujärves, Peteras, Petroskois, Petroskoispäi
- Ess
- ADJ: Parahannu, Tundemattominnu, Tärgienny, kolmandennu, muinazennu, vähäelendettävänny
- NOUN: alguhpanijannu, piätavoittehennu, Vuvvennu, aijannu, lajinnu, piälikönny, piän, päivänny, ruavonnu
- PRON: sinä
- VERB-Part: järjestäjänny
- Gen
- ADJ: tverinkarjalazien, Myöhembäite, erähien, kaikkien, kyläläzien, suomalasugrilazen, vahnoin
- NOUN: tverinkarjalazien, Arbaituksen, Liiton, arbaituksien, nuorien, nuorižon, orazen, päivän, saaran, tverinkarjalan
- PRON: tämän, minun, Niilöin, hänen, kai, kuduan, meijän, sen
- PROPN: Tverin, Karjalan, Anuksen, Petroskoin, Tuuksen, Koverin, Lihoslavl’an, Mägriän, Periodikan, Peteran
- VERB-Part: mainittuloin
- Ill
- ADJ: Suureh, jogapäiväzeh, omah
- NOUN: elaigah, matkah, piirih, tabah, Kilboih, Pidoh, arbuamizeh, bokkah, eroh, ilmoih
- PROPN: Karjalah
- VERB: arbuamah, ellendämäh, kuundelemah, saamah, sanomah, elämäh, ezittymäh, miettimäh, mustoittamah, sanelemah
- VERB-Inf: arbuamah, ellendämäh, kuundelemah, saamah, sanomah, ezittymäh, miettimäh, mustoittamah, sanelemah
- Ine
- ADJ: hyväs, jogapäiväzis, karjalazes, karjalazis, moizes, omas, toizis, vahnas
- AUX-Ger: olles
- NOUN: arbaitukses, mieles, tekstois, veššilöis, arbaituksis, argielaijas, huondespuoles, kodikyläs, konferensies, kul’tuuratalois
- PRON: hänes, kus, mis, nämmis
- PROPN: Suomes, Karjalas
- VERB-Ger: kuunneltes
- VERB-Inf: luadimas
- Ins
- NOUN: festivualin
- NUM: kaksi
- Nom
- ADJ: Karjalazet, Toine, bohattu, jygei, 30., Arbuamatoi, karjalaine, kolmas, kylmyverizembi, mennyh
- NOUN: vojennoit, saari, briha, taatto, bobuli-briha, arbaitukset, bohattu, häkki, kodi, lapset
- NUM: kolme, seičče, 2010-2014, 2017, kaksi, kolmas, kolmet, yksi
- PRON: häi, se, toine, hyö, tämä, iče, ken, minä, net, kudamat
- PROPN: Mustonen, Peter, Mary, Tapio, Virtaranta, Galina, Iguazu, Jane, Kajahuš, Karelija
- VERB-Part: kehitynnyh, tundiettu
- Par
- ADJ: kielitiijollizii, semmostu, ennevahnallizii, erilazii, karjalankielisty, koskijoi, mifolougistu, miiffizii, muudu, nuordu
- NOUN: virstaa, piduhuttu, saaraa, arbaituksii, levevytty, torvindaa, Karjalua, dieloloi, ildastu, joukkuo
- PRON: midä, Midäbo, Tädä, heidy, händy, kudamua, niidy, nimidä, sidä, sinuu
- PROPN: Brownii, Smithua
- VERB-Part: koskijoi, sanottuu
- X: d’engaa, piduhuttu, puččii
- Ter
- ADJ: omassah
- NOUN: päivässäh
- Tra
- ADJ: omakse, pahakse
- ADP: hyväkse
- NOUN: kezäkse, talvekse, ilokse, mielekse, vellakse
- PROPN: Lönnrotakse
Degree and Polarity
- Cmp
- ADJ: kylmyverizembi
- Pos
- VERB-Part: sanottuu
- Neg
- AUX: ei, emmogo, En
- CCONJ: eigo
- PRON: nimidä
Verbal Features
- Cnd
- AUX-Fin: olis, voidas
- Imp
- VERB-Fin: Avua, Kuunelkaa, mennä
- Ind
- AUX: oli, on, ollah, voibi, ei, ole, olen, Ongo, pidänyh, voidu
- AUX-Fin: oli, on, ollah, voibi, ole, olen, Ongo, pidänyh, voit
- NOUN-Fin: sualis
- VERB: sanoi, pietäh, rodieu, sanoo, kuulimo, kuulittogo, sanottih, tiezimö, tiezittö, istui
- VERB-Fin: sanoi, rodieu, sanoo, kuulimo, kuulittogo, pietäh, sanottih, tiezimö, tiezittö, istui
- VERB-Part: käynnyh
- Pot
- AUX-Fin: voinoo
- VERB-Fin: unohtannet
- Past
- AUX: oli, pidänyh, suannuh, voidu
- AUX-Fin: oli, pidänyh
- AUX-Part: suannuh
- VERB-Fin: sanoi, sanottih, istui, kraassi, kuulittogo, kuulluh, lähtiettih, oli, saneltih, tiezittö
- VERB-Part: käynnyh, tundiettu, kehitynnyh, mainittuloin, sanottuu, tulluot
- Pres
- AUX: on, ollah, voibi, ole, olen, roitah, Ei, Ongo, olis, voidas
- AUX-Fin: on, ollah, voibi, ole, olen, Ongo, olis, voidas, voit
- NOUN-Fin: sualis
- VERB: pietäh, rodieu, sanoo, kyzyy, olen, on, sanou, tulou, avvutetah, ečitäh
- VERB-Fin: rodieu, pietäh, sanoo, kyzyy, olen, on, sanou, tulou, avvutetah, ečitäh
- VERB-Part: järjestäjänny
- Act
- AUX-Fin: oli, on, ollah, voibi, ole, olen, Ongo, olis, pidänyh, voidas
- NOUN-Fin: sualis
- VERB-Fin: sanoi, rodieu, kuulimo, kuulittogo, sanoo, sanottih, tiezimö, tiezittö, istui, kraassi
- VERB-Part: käynnyh, järjestäjänny, koskijoi, tulluot
- Pass
- AUX: voidu
- VERB: pietäh, tundiettu, ečitäh, järjestetäh, kannatetah, kuunneltes, mainittuloin, sanottuu
- VERB-Fin: pietäh, ečitäh, kannatetah
- VERB-Ger: kuunneltes
- VERB-Part: tundiettu, mainittuloin, sanottuu
Pronouns, Determiners, Quantifiers
- Dem
- PRON: tämän, se, tämä, net, Niilöin, Tädä, niidy, nämmis, sen, sil
- Ind
- PRON: mondu, nimidä
- Prs
- PRON: häi, minun, minul, hyö, minä, Heil, Hänel, heidy, händy, hänele
- Rel
- PRON: kudamat, kudamua, kuduan, kuduat
- Card
- NUM: kolme, kaksi, seičče, kolmet, yksi
- Ord
- ADJ: 23., Enzimäine, Toine, kolmandennu, kolmas
- NUM: kolmas
- Yes
- PRON: iče
- VERB-Fin: sevättihes
- 0
- AUX: Ei
- 1
- AUX: emmogo, olen, En
- AUX-Fin: olen
- PRON: minun, minul, Minä, meijän, myö
- VERB-Fin: kuulimo, näimö, olen, tiezimö, sanon, Smietin, annan, otamo, pään, sanoo
- 2
- AUX-Fin: voit
- PRON: sinuu
- VERB-Fin: kuulittogo, tiezittö, Avua, Kuunelkaa, Nai, Tahtotgo, Tiezittögo, duumaičet, kačot, kuulitto
- 3
- AUX: oli, ei, on, ollah, voibi, Ongo, voidas, voinoo
- AUX-Fin: oli, on, ollah, voibi, Ongo, voidas, voinoo
- CCONJ: eigo
- NOUN-Fin: sualis
- PRON: häi, hyö, Heil, Hänel, heidy, händy, hänele, hänen, hänes
- VERB: sanoi, rodieu, sanoo, sanottih, istui, kraassi, kyzyy, lähtiettih, menöö, oli
- VERB-Fin: sanoi, rodieu, sanoo, sanottih, istui, kraassi, kyzyy, lähtiettih, menöö, oli
- Sing
- ADJ: enimilleh
- NOUN: dovarišalles
Other Features
- AdpType
- Post
- ADP: mugah, periä, sijah
- Post
- Clitic
- Gi
- PROPN: Suomesgi
- Go
- AUX-Fin: Ongo
- VERB-Fin: kuulittogo, Tahtotgo, Tiezittögo
- Ko
- AUX: emmogo
- Gi
- Connegative
- Yes
- AUX: ole, olis, pidänyh, voidu
- AUX-Fin: ole, olis, pidänyh
- VERB: kuulluh, arbailla, ehtinyh, kylmetty, löytä, musta, nähty, ole, olla, sanottu
- VERB-Fin: kuulluh, arbailla, ehtinyh, kylmetty, musta, nähty, ole, olla, sanottu, teidänyh
- Yes
- Foreign
- Yes
- X: Karelija, eto, mi, –
- Yes
- Person[psor]
- 3
- ADJ: enimilleh
- NOUN: dovarišalles
- 3
- Typo
- Yes
- NOUN: Čičiliušku-t
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: olla.
- This corpus uses 5 lemmas as auxiliaries (aux). Examples: ei, voija, olla, pidiä, rotie.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Nom (2)
- VERB--PRON-Nom (1)
- VERB-Fin--NOUN (2)
- VERB-Fin--NOUN-Acc (4)
- VERB-Fin--NOUN-Nom (59)
- VERB-Fin--NOUN-Par (5)
- VERB-Fin--PRON-Nom (26)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--NOUN-Nom (1)
- VERB-Inf--PRON-Ade (2)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN-Nom (3)
- obj
- VERB--NOUN-Par (2)
- VERB-Fin--NOUN-Acc (10)
- VERB-Fin--NOUN-Gen (2)
- VERB-Fin--NOUN-Nom (6)
- VERB-Fin--NOUN-Par (27)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Gen (6)
- VERB-Fin--PRON-Nom (1)
- VERB-Fin--PRON-Par (9)
- VERB-Inf--NOUN-Acc (2)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Par (14)
- VERB-Inf--PRON-Par (1)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Par (1)
Relations Overview
- This corpus uses 9 relation subtypes: acl:relcl, compound:nn, cop:own, csubj:cop, flat:foreign, flat:name, nmod:poss, nsubj:cop, xcomp:ds
- The following 2 main types are not used alone, they are always subtyped: csubj, flat
- The following 7 relation types are not used in this corpus at all: iobj, expl, dislocated, clf, list, reparandum, dep