UD Finnish OOD
Language: Finnish (code: fi
)
Family: Uralic
This treebank has been part of Universal Dependencies since the UD v2.7 release.
The following people have contributed to making this treebank part of UD: Jenna Kanerva.
Repository: UD_Finnish-OOD
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: medical, web, social, poetry
Questions, comments? General annotation questions (either Finnish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [jmnybl (æt) utu • fi]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | not available |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
Finnish-OOD is an external out-of-domain test set for Finnish-TDT annotated natively into UD scheme.
The treebank contains texts from anonymized nursing narratives (hospital patient records), discussion forums, tweets, general web crawls and poetry collected from the Internet. Text sources are marked as sentence identifier prefixes (# sent_id = identifier
), cl = nursing narratives, thread = discussion forums, tweet = tweets, web = web crawl, and poem = poetry. The document structure can also been resolved from the sentence identifiers.
Acknowledgments
Annotation: Jenna Kanerva
Text sources collected by TurkuNLP research group, especially Jenna Kanerva, Filip Ginter, Veronika Laippala and Juhani Luotolahti.
The poetry section is extracted from the Finnish Corpus of Online Registers (FinCORE, link), and the web crawl section is extracted from the Finnish Internet Parsebank (link).
References
@inproceedings{kanerva-2022-ood,
title = "Out-of-Domain Evaluation of Finnish Dependency Parsing",
author = {Kanerva, Jenna and Ginter, Filip},
booktitle = "Proceedings of the 13th International Conference on Language Resources and Evaluation (LREC'22)",
year = "2022",
pages = "1114‑-1124",
url = "http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.120.pdf"
}
Statistics of UD Finnish OOD
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – Case – Clitic – Connegative – Degree – Derivation – Foreign – InfForm – Mood – Number – Number[psor] – NumType – PartForm – Person – Person[psor] – Polarity – PronType – Reflex – Style – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – cc:preconj – ccomp – compound – compound:nn – compound:prt – conj – cop – cop:own – csubj – csubj:cop – dep – det – discourse – dislocated – fixed – flat – flat:foreign – flat:name – goeswith – mark – nmod – nmod:gobj – nmod:gsubj – nmod:poss – nsubj – nsubj:cop – nsubj:outer – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp – xcomp:ds
Tokenization and Word Segmentation
- This corpus contains 2122 sentences, 19363 tokens and 19382 syntactic words.
- This corpus contains 3188 tokens (16%) that are not followed by a space.
- This corpus contains 4 types of words with spaces. Examples: 1 400, 103 000, 14 700, 2 500
- This corpus contains 575 types of words that contain both letters and punctuation. Examples: RR-taso, kl., sp., mg/vrk, heng., pot., syst., esim., ml/h, mm., :D, thx-kuvassa, @JunesLokka, Bipap:lle, L., MM-kisojen, VM:lla, n., tms., ts., yms., #cmoref1, #johtaminen, #metsä, #nature, #uutisvahti, 2000-luvun, @sannigrahn, Bipap-maskilla, CPAP:lle, Duoderm-levy, Noradrenalin-tukea, Oy:ltä, RR:n, SDP:n, WSOY:n, harj., inf., ja/tai, jne., kendall-kostukselle, ko-operoiva, konefr., mahd., noradr., p.o, pass., po., rivi-ilmoituksen, rr-tason
- This corpus contains 19 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 7 types of multi-word tokens. Examples: ettei, jollei, muttei, etteikö, vaikkei, Eiku, mikseivät.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: DET, PART
- This corpus contains 41 lemmas tagged as pronouns (PRON): ainoa, ainut, eräs, harva, he, hän, inse, itsari, itse, itsessään, joka, jokainen, jokin, joku, kaikkea, kaikki, kuka, kukaan, kumpi, kumpikin, meillä, mikin, mikä, mikään, minä, molemmat, moni, monta, muu, muutama, nuo, sama, samoin, se, sinä, sitä, toinen, tuo, tämä, varsikin, yksi
- This corpus contains 0 lemmas tagged as determiners (DET):
- This corpus contains 10 lemmas tagged as auxiliaries (AUX): ei, joutua, mahtaa, olla, pitää, saattaa, taitaa, tarvita, täytyä, voida
- Out of the above, 7 lemmas occurred sometimes as AUX and sometimes as VERB: ei, joutua, olla, pitää, saattaa, tarvita, voida
- There are 3 (de)verbal forms:
- Fin
- AUX: on, ei, oli, ole, en, ovat, voi, eikä, olisi, olen
- NOUN: kaivelette
- VERB: saa, tulee, hapettuu, sai, alkoi, löytyy, laskee, menee, kertoo, laski
- Inf
- AUX: olla, olemaan, ollessa, joutua, ollessaan, pitää
- NOUN: kumarrella
- VERB: saada, tehdä, katsomassa, tulla, laskemaan, nukkuessa, käymään, pitää, mennä, menossa
- Part
- ADJ: tulevaan
- AUX: ollut, olevan, jouduttu, olleet, voinut, olevansa, oltava, joutunut, ollet, ollu
- VERB: saanut, aloitettu, laitettu, päästy, vaihdettu, käynyt, nukkunut, lopetettu, nostettu, tehty
Nominal Features
- Plur
- ADJ: omat, omia, hyviä, hyvät, pieniä, väkevien, matalat, pitkiä, uusia, Parhaat
- ADP: tiimoilta
- ADV: hoitolinjoin
- AUX-Fin: ovat, eivät, olimme, on, oli, olivat, Olemme, Olkoot, ei, eivätkä
- AUX-Part: olleet, ollet
- NOUN: omaiset, paineet, nymfit, ihmisiä, nuorten, lapset, lehdet, töitä, yhteydenottoja, Täyttöpaineet
- NOUN-Fin: kaivelette
- NUM: satoja, satojen
- PRON: ne, niitä, jotka, he, meidän, heidän, me, joilla, kaikille, meillä
- PROPN: #oscarit, @Duudsonit, @Lukiolaiset, @NVUutiset, @PorinAssat, @SuomenEkonomit, Absojen, Alankomaihin, Canesten, Duodermit
- VERB: saavat, edistäviin, etenevät, haluatte, jäävät, kasvaneet, koskevat, käyneet, laskivat, liittyvistä
- VERB-Fin: saavat, etenevät, haluatte, jäävät, laskivat, nousivat, pystyvät, saivat, sanovat, soitamme
- VERB-Part: edistäviin, kasvaneet, koskevat, käyneet, liittyvistä, näkyvissä, tehtyjä, Diagnosoidut, Jutelleet, Lakitetut
- Sing
- ADJ: hyvä, pitkä, rauhallinen, korkea, oma, vanha, hyvää, huono, toinen, uuden
- ADJ-Part: tulevaan
- ADV: aika, itelläni, kipuun, kumma, muun
- AUX-Fin: on, ei, oli, en, eikä, voi, olen, olisi, pitäisi, voisi
- AUX-Inf: olla, olemaan, ollessa, joutua, ollessaan, pitää
- AUX-Part: ollut, olevan, jouduttu, voinut, olevansa, oltava, joutunut, ollu, tainnut, tarvinnut
- NOUN: diureesi, hemodynamiikka, hapetus, hengitys, pulssi, aikana, Tajunta, yövuoro, aamulla, illalla
- NOUN-Inf: kumarrella
- NUM: yksi, kaksi, pari, kolme, yhden, kahden, kolmeen, kolmen, neljä, neljän
- PRON: se, sen, joka, hän, kaikki, mitä, sitä, muuta, tällä, tämä
- PROPN: furesis, Esko, Tymppis, Tymppiksen, the, sp., Eskon, Suomi, suomessa, noradrenalina
- VERB: saanut, tulee, saa, aloitettu, hapettuu, laitettu, sai, alkoi, päästy, saada
- VERB-Fin: tulee, saa, hapettuu, sai, alkoi, löytyy, laskee, menee, kertoo, laski
- VERB-Inf: saada, tehdä, katsomassa, tulla, laskemaan, nukkuessa, käymään, pitää, mennä, menossa
- VERB-Part: saanut, aloitettu, laitettu, päästy, vaihdettu, käynyt, nukkunut, lopetettu, nostettu, tehty
- X: Creator, HERAUS, SATAN, poro
- Abe
- NOUN: ongelmitta, vastikkeetta, veloituksetta
- VERB-Inf: Saavuttamatta, aiheuttamatta, antamatta, asettamatta, ihailematta, juomatta, korostamatta, käynnistämättä, puhumattakaan, purskahtamatta
- Abl
- ADJ: Kansainväliseltä, alhaiselta, asialliselta, hurjalta, hyvältä, ihanalta, nimiseltä, omalta, orientoituneelta, otolliselta
- ADP: tiimoilta
- NOUN: hotellilta, potilaalta, yhteistyökumppaneilta, Ensimetreiltä, KANNALTA, MTV-kanavalta, PUOLUEELTA, Pientuottajilta, Puolilta, Reunalta
- NUM: neljältä
- PRON: jokaiselta, Keneltä, Muilta, eräältä, häneltä, joltain, siltä, tältä
- PROPN: Oy:ltä, Katalonialta, Kelalta, Lokomotivilta
- VERB-Part: haetuilta, raiskatuilta
- Acc
- PRON: hänet, Meidät, heidät, itsesi, minut
- Ade
- ADJ: hyvällä, omalla, pienellä, Oikealla, Tähänastisella, Täpötäydellä, Vähemmälläkin, Ylemmillä, entisellä, eteläisellä
- ADV: itelläni
- NOUN: aamulla, illalla, viikolla, iltapäivällä, avulla, hetkellä, puolella, tasolla, tauolla, yöllä
- NUM: kahdella, yhdellä
- PRON: tällä, jolla, sillä, joilla, meillä, millä, heillä, hänellä, minulla, mulla
- PROPN: furesiksella, Tavastialla, Drägerillä, Uudellamaalla, malmilla, Admiralilla, Bennetillä, Bennetilläkään, Guinealla, Itäväylällä
- VERB: antamalla, kehumalla, kirjoittamilla, klikkaamalla, kääntyilemällä, mielellänne, ostamalla, riuhtomalla, sijoittuvalla, täyttämällä
- VERB-Inf: antamalla, kehumalla, klikkaamalla, kääntyilemällä, ostamalla, riuhtomalla, täyttämällä, valitsemalla
- VERB-Part: kirjoittamilla, sijoittuvalla, vaihtelevalla
- All
- ADJ: Oikealle, Suomalaisille, Uusille, Vasemmalle, hienolle, hintelälle, ikäiselle, ikäisille, jälkimmäiselle, kovimmallekin
- NOUN: Bipap:lle, CPAP:lle, alkuasukkaille, cpapille, hautausmaalle, kendall-kostukselle, kohdalle, lapselle, ostoksille, 1940-luvulle
- PRON: hänelle, kaikille, minulle, sinulle, kenellekään, niille, itselleen, tälle, joillekin, jokaiselle
- PROPN: Malmille, Tymppikselle, Allielle, Eskolle, Furesikselle, Heidille, Hämeenkadulle, Lapinjärvelle, Maurille, Nokialle
- VERB-Part: dementoituneelle, edeltäneelle, eksyneille, omaaville, osallistuvalle, tarvitseville, tehneille
- Com
- NOUN: eläimineen, fiftarimekkoineen, huulipunineen, höysteineen
- PRON: kaikkine
- Ela
- ADJ: korkeista, omasta, 15–24-vuotiaista, Absoluuttisesta, Asunnottomista, aiheisista, asiallisista, ensimmäisestä, fantastisesta, iloisista
- NOUN: putkesta, asioista, mielestä, sydämestä, Joulumaasta, Pumppudreenistä, aiheesta, arvoista, elämästäni, jalasta
- NUM: sadasta, yhdestä
- PRON: siitä, josta, tästä, jostain, näistä, itsestään, joista, kaikesta, niistä, Mistäkö
- PROPN: Kelasta, suomesta, Alanyasta, Dormicumista, Jatkoajasta, JavaScriptistä, Shanghaista, Sydneystä, facebookista, ikeastahan
- VERB: liittyvistä, kultivoituneesta, olemasta, säästä
- VERB-Inf: olemasta
- VERB-Part: liittyvistä, kultivoituneesta
- Ess
- ADJ: väsyneenä, Jääkaappikylmänä, Nuorempana, ensimmäisenä, harkinnanvaraisen, harkinnanvaraisena, hartaina, hyvänä, idyllisenä, kohtuullisina
- NOUN: aikana, vuonna, seurauksena, tarkoituksena, kesänä, päivänä, sunnuntaina, syynä, tapana, yönä
- NUM: toissa, yhtenä
- PRON: tänä, itsenä, joinakin, muina, tänäkään
- VERB-Part: verrattuna, katsottuna, Sedatoituna, karkeastisanottuna, kiinnostuneena, lukittuna, muunnettuna, muutettuina, nautittuna, nähtynä
- Gen
- ADJ: uuden, oman, hyvän, viimeisen, väkevien, Sentraalisen, erityisen, suuren, hirmuisen, huonon
- ADV: muun
- AUX-Part: olevan, olevansa
- NOUN: yön, vuoden, potilaan, lastin, nuorten, päivän, ajan, lapsen, rakkauden, sarjan
- NUM: yhden, kahden, kolmen, neljän, parin, sadan, 100.n, 1000e, 100:n, 2:n
- PRON: sen, tämän, jonka, hänen, meidän, minun, heidän, kaiken, jonkin, minkä
- PROPN: Tymppiksen, Eskon, suomen, Allien, Furesiksen, Jeesuksen, Jortikan, Kelan, Liikenneturvan, Luhtasen
- VERB: jättämäni, ymmärtävän, arvostavan, auttavan, haukkuvan, jatkuvan, kalastavan, kalifornialaistuneen, kirjoittaneen, koittaneen
- VERB-Part: jättämäni, ymmärtävän, arvostavan, auttavan, haukkuvan, jatkuvan, kalastavan, kalifornialaistuneen, kirjoittaneen, koittaneen
- Ill
- ADJ: Sanattomaan, eiliseen, elävään, erityiseen, hamaan, huonoon, kreikkalaiseen, kulloiseenkin, kömpelöihin, lukuisiin
- ADJ-Part: tulevaan
- ADV: kipuun
- AUX-Inf: olemaan
- NOUN: aikaan, loppuun, kotiin, pintaan, nivuseen, päivään, aikoihin, alkuun, elämään, hintaan
- NUM: kolmeen
- PRON: siihen, tähän, johon, samaan, jonne, kaikkeen, muihin, noihin, häneen, itseensä
- PROPN: Guineaan, Saksaan, Uuteen, suomeen, Alankomaihin, Australiaan, Brasiliaan, Britanniaan, Dubaihin, Espanjaan
- VERB-Inf: laskemaan, käymään, tekemään, katsomaan, nostamaan, tietämään, vähentämään, auttamaan, huuhtelemaan, laittamaan
- VERB-Part: edistäviin, istuvaan, kirjoitettuun, niukentuneeseen, paketoituun, päivystävään, tapahtuviin, tehtyihin
- Ine
- ADJ: lyhyessä, omassa, Oikeassa, ammatillisissa, erillisissä, halvoissakaan, hirviömäisessä, ilonen, kevyessa, l.sin.
- AUX-Inf: ollessa, ollessaan
- NOUN: vaiheessa, yhteydessä, kyseessä, thx-kuvassa, helmikuussa, tapauksessa, vuodessa, Sacrumissa, aamupesuissa, ajassa
- NUM: 3ssa, kolmessa
- PRON: jossa, siinä, tässä, missä, jossain, muissa, Missähän, Noissa, hänessä, joissa
- PROPN: suomessa, Aurassa, Sidessä, @antroblogi'ssa, Aasiassa, Alanyassakin, Amerikassa, Barcelonassa, Bilbaossa, Dubaissa
- VERB-Inf: katsomassa, nukkuessa, menossa, tullessa, käymässä, käynnissä, nähdessään, olemassa, tulossa, valitessa
- VERB-Part: näkyvissä, nähtävissä, takavarikoidussa, vältettävissä
- Ins
- ADJ: Pienin, epävakain, italialaisin, kreikkalaisin
- ADV: hoitolinjoin
- NOUN: puolin, tavoin, turvin, juoksuin, jäljin, järvin, käsin, metsin, mielin, muutoksin
- PRON: molemmin, monin, samoin
- VERB-Inf: istuen, Viitaten, estäen, ihmetellen, kurtistellen, käännyttäen, loikkien, lähettäen, noudattaen, odottaen
- VERB-Part: Ojennetuin, suljetuin
- Nom
- ADJ: hyvä, pitkä, rauhallinen, korkea, oma, vanha, huono, omat, toinen, asiallinen
- ADV: aika, kumma
- AUX-Part: ollut, jouduttu, olleet, voinut, oltava, joutunut, ollet, ollu, tainnut, tarvinnut
- NOUN: diureesi, hemodynamiikka, hapetus, hengitys, pulssi, omaiset, Tajunta, yövuoro, co2, poika
- NUM: yksi, kaksi, pari, kolme, neljä, puoli, sata, yhdeksän, 10, kahdeksan
- PRON: se, joka, hän, kaikki, tämä, ne, mikä, jotka, he, me
- PROPN: furesis, Esko, Tymppis, the, sp., Suomi, noradrenalina, America, Captain, Nooa
- VERB: saanut, aloitettu, laitettu, päästy, vaihdettu, käynyt, nukkunut, lopetettu, nostettu, tehty
- VERB-Part: saanut, aloitettu, laitettu, päästy, vaihdettu, käynyt, nukkunut, lopetettu, nostettu, tehty
- X: Creator, HERAUS, SATAN, poro
- Par
- ADJ: hyvää, omia, hyviä, niukkaa, riittävää, helppoa, parasta, pieniä, runsasta, ensimmäistä
- NOUN: aikaa, kertaa, mg, prosenttia, tietoa, ihmisiä, limaa, asentoa, limaisuutta, maata
- NUM: satoja, kolmattasataa, toistasataa
- PRON: mitä, sitä, muuta, niitä, jotain, mitään, jota, tätä, kaikkea, heitä
- PROPN: furesista, Oxanestia, Eskoa, Bachia, Nitroa, Opamoxia, Stesolidia, Abbodopia, Allieta, Ativania
- VERB-Part: purettua, valkaistua, saatuaan, tapahtuvaa, tehtyjä, viemää, alentavaa, avattuaan, eristäviä, harkittuja
- Tra
- ADJ: huonoksi, sinisilmäiseksi, työläämmäksi, Suurimmaksi, Toiseksi, ahdistuneemmaksi, alkoholipoliittiseksi, ensimmäiseksi, helpommiksi, historialliseksi
- NOUN: ajaksi, hetkeksi, ohjelmointikieleksi, Eturuoaksi, Sääliksi, Yöksi, alkoholiksi, asemasodaksi, hoitajaksi, huvikseni
- VERB-Inf: muistaakseni, auttaakseen, herättääkseeni, hämätäkseen, käsittääkseni, pitääkseen, suorittamastanne, säilyäkseen, tietääkseni, ymmärtääkseni
- VERB-Part: esitettäväksi, jaettavaksi, puretuksi, testattavaks
Degree and Polarity
- Cmp
- ADJ: lämmin, matalampaa, matalampi, suurempi, työläämmäksi, tärkeämpiä, useampia, Alempi, Nuorempana, PAHEMPI
- ADV: paremmin, huonommin, lähempänä, helpommin, pahemmin, pahemminkin
- Pos
- ADJ: hyvä, pitkä, rauhallinen, korkea, oma, vanha, hyvää, huono, omat, uuden
- ADJ-Part: tulevaan
- ADV: kumma
- Sup
- ADJ: paras, parasta, suosituin, Parhaat, suurimman, Halutuimpia, Naurettavinta, Suurimmaksi, TURVALLISINTA, alin
- ADV: parhaiten, helpoiten
- Neg
- AUX-Fin: ei, en, eikä, eivät, enkä, eikö, et, älä, Enpä, Ethän
- VERB-Fin: ei, eikä
Verbal Features
- Cnd
- AUX-Fin: olisi, pitäisi, voisi, olisin, Olisko, Pitäisikö, Voisko, olis, olisisi, olisivat
- VERB-Fin: tulisi, tuntuisi, saisi, kiinnostaisi, saataisiin, valitsisi, Halkaisisin, Haluaisin, Käyttäisinkin, Luulisikin
- Imp
- AUX-Fin: älä, Ethän, Olkoot, älkää
- VERB-Fin: Lue, anna, hae, osta, seuraa, Johda, KUUNTELE, Keskustele, Kirjaudu, Koeta
- Ind
- AUX-Fin: on, oli, ole, ovat, voi, olen, voit, onko, pitää, onkin
- NOUN-Fin: kaivelette
- VERB-Fin: saa, tulee, hapettuu, sai, alkoi, löytyy, laskee, menee, kertoo, laski
- Pot
- AUX-Fin: lienee, voinee
- VERB-Fin: kertonee, käynee
- Past
- AUX-Fin: oli, olimme, olin, olikin, olivat, taisi, Oliko, Olit, jouduin, liekö
- VERB-Fin: sai, alkoi, laski, näin, tuli, nousi, meni, sain, kertoi, nukkui
- Pres
- AUX-Fin: on, ole, ovat, voi, olen, voit, onko, pitää, onkin, oon
- NOUN-Fin: kaivelette
- VERB-Fin: saa, tulee, hapettuu, löytyy, laskee, menee, kertoo, tule, jatkuu, halua
- Act
- ADJ-Part: tulevaan
- AUX-Fin: on, ei, oli, en, ovat, eikä, voi, olen, olisi, eivät
- AUX-Inf: olla, olemaan, ollessa, joutua, ollessaan, pitää
- AUX-Part: ollut, olevan, olleet, voinut, olevansa, joutunut, ollet, ollu, tainnut, tarvinnut
- NOUN-Fin: kaivelette
- NOUN-Inf: kumarrella
- VERB-Fin: tulee, saa, hapettuu, sai, alkoi, löytyy, laskee, menee, kertoo, laski
- VERB-Inf: saada, tehdä, katsomassa, tulla, laskemaan, nukkuessa, käymään, pitää, mennä, menossa
- VERB-Part: saanut, käynyt, nukkunut, soittanut, tullut, orientoitunut, mennyt, pysynyt, hapettunut, laskenut
- Pass
- AUX-Fin: ollaan, voidaan, mahtaako, olla, oltiin, voida
- AUX-Part: jouduttu, oltava
- VERB-Fin: jatketaan, nostetaan, odotellaan, anneta, annetaan, arvottiin, julkaistiin, järjestetään, kuvitellaan, käännytetään
- VERB-Inf: Käännettäessä, kysyttäessä, liikuteltaessa, mitattaessa, pyydettäessä
- VERB-Part: aloitettu, laitettu, päästy, vaihdettu, lopetettu, nostettu, tehty, käytetty, vähennetty, annettu
Pronouns, Determiners, Quantifiers
- Dem
- PRON: se, sen, sitä, tällä, tämä, siitä, ne, niitä, tämän, siinä
- Ind
- ADV: muun
- PRON: kaikki, muuta, jotain, mitään, kaiken, ainoa, joku, jonkin, kaikille, kaikkea
- Int
- PRON: mitä, mikä, millä, kuka, minkä, Keneltä, Ketä, Missähän, Mistäkö, Mitäs
- Prs
- PRON: hän, he, hänen, meidän, minun, hänelle, heidän, me, minä, meillä
- Rcp
- ADJ: toista
- PRON: toinen, toisensa, toisemme, toisen, toisenkin, toisiamme, toisiinsa
- Rel
- PRON: joka, jolla, jonka, jossa, jotka, josta, mitä, jota, mikä, joilla
- Card
- NUM: 2, 40, 20, 5, 10, 100, 60, 90, 2014, yksi
- Ord
- ADJ: 1., 2., toinen, 14., 3., ensimmäinen, 4., 5., 9., ensimmäistä
- PRON: Toinen, toiseen
- Yes
- ADV: itelläni
- PRON: itsensä, itse, itseni, itselleen, itsestään, itseensä, itsellä, itselläkin, itsemme, itsestäni
- 0
- AUX-Fin: on, voi, pitää, oli, täytyy, Taitaa, olisi, pitäisi, voisi
- VERB-Fin: saa, pääsee, hengittelee, käy, tulee, tuntuu, Tuntui, ei, haluaa, heräsi
- 1
- AUX-Fin: en, olen, enkä, oon, olimme, olin, olisin, Enpä, Olemme, Olisko
- PRON: meidän, minun, me, minä, meillä, minulle, mä, minua, minulla, Meidät
- VERB-Fin: näin, sain, haluan, mietin, opettelen, teen, katson, tiedän, Arvostan, Inhoan
- 2
- AUX-Fin: voit, et, älä, Ethän, Oletko, Olit, Ootko, etkä, voitte, älkää
- NOUN-Fin: kaivelette
- PRON: sinulle, sinua, sinun, sinä, Sulla, Te, itsesi, sinusta, sua, sun
- VERB-Fin: Lue, saat, ostat, anna, hae, haluatte, osta, seuraa, Johda, KUUNTELE
- 3
- AUX-Fin: on, ei, oli, ovat, eikä, voi, olisi, eivät, pitäisi, voisi
- PRON: hän, he, hänen, hänelle, heidän, heitä, heillä, hänellä, hänet, heidät
- VERB-Fin: tulee, hapettuu, alkoi, sai, löytyy, saa, laskee, menee, kertoo, laski
- Plur
- NOUN: Hommanamme, epäpuhtautemme, hotellissamme, kaupunkilehteemme, koirastamme, kotiovellemme, kropassa, maahamme, perheeseemme, perunakauppiaamme
- PRON: itsemme, toisemme, toisiamme
- VERB: merkkaamamme, mielellänne, suorittamastanne
- VERB-Inf: suorittamastanne
- VERB-Part: merkkaamamme
- Sing
- ADJ: kaltaiseni
- ADP: luotani
- ADV: itelläni, kanssasi, kimppuuni, vieressäni
- NOUN: elämäni, poikani, elämäsi, elämästäni, mielestäni, mieltäni, poikaani, päässäni, sieluni, silmiini
- PRON: itseni, itsestäni, itseäni
- VERB: jättämäni, muistaakseni, Uneksiessasi, halutessasi, herättääkseeni, kertomani, kirjoittaessani, kuuluvani, käsittääkseni, käyttäessäsi
- VERB-Inf: muistaakseni, Uneksiessasi, halutessasi, herättääkseeni, kirjoittaessani, käsittääkseni, käyttäessäsi, pyrähtäessäni, tietääkseni, uidessasi
- VERB-Part: jättämäni, kertomani, kuuluvani, löytäväni, postanneeni, saavani, sanovasi, twiittaamasi
Other Features
- Abbr
- Yes
- ADJ: syst., mahd., pass., P.O, Vas., eteisper., oik., psyykk., sis., tas.
- ADP: ad, ad., alk.
- ADV: esim., jne, mm., n., yms., jne., jnk, tms., ed., edell.
- NOUN: co2, RR, sr, klo, mg, kl., mg/vrk, Hb, heng., pot.
- PROPN: L., Aller, SDP:n, #WHO, #tvof, #vpk, @MTKry, A., Absojen, CS:n
- VERB-Fin: ks.
- VERB-Part: aloit.
- Yes
- AdpType
- Post
- ADP: kanssa, jälkeen, mukaan, vuoksi, takia, päälle, saakka, asti, päällä, sijaan
- Prep
- ADP: ilman, ad, päälle, alle, ennen, yli, keskellä, Luo, kohti, per
- Post
- Clitic
- Han
- ADV: Niinhän, näinhän, Itehän, mukavastihan
- AUX-Fin: Onhan, olihan, olisihan
- NOUN: Inflaatiohan, Mittasuhteethan, erohan, kapeahan, kuvitelmissasihan, merkkauksessahan, osarillahan, pakkohan, rakkaushan
- PRON: Minullahan, Missähän, sitähän
- PROPN: ikeastahan
- SCONJ: kunhan
- VERB-Fin: Tuleehan
- Han,Pa
- VERB-Fin: Satunpahan
- Ka
- AUX-Fin: eikä, enkä, eivätkä, etkä
- VERB-Fin: eikä
- Kaan
- ADJ: halvoissakaan
- ADV: juurikaan, alkuunkaan, itsekään, mullakaan, nytkään, siltikään, sittenkään, varmaankaan, normaalistikaan, varmastikaan
- NOUN: Alphallakaan, epäilystäkään, henkilöllisyyttäkään, viskiäkään
- PRON: sekään, muitakaan, muutakaan, siihenkään, tänäkään
- PROPN: Bennetilläkään
- VERB-Inf: puhumattakaan
- VERB-Part: kuullutkaan, tiennytkään, vaatineetkin
- Kin
- ADJ: Vähemmälläkin, isompikin, kulloiseenkin, sellaisiakin
- ADV: muutenkin, enemmänkin, hyvinkin, ennenkin, itsekin, kovastikin, liiankin, muutoinkin, nykyäänkin, olkoonkin
- AUX-Fin: onkin, olikin, olivatkin
- NOUN: aamupuurollekin, hetkenkin, kaasuunkin, kenetkin, kotosuomessakin, kukkiakin, kuvakin, käytöstäkin, lapsillekin, luntakin
- PRON: muutakin, Meilläkin, Tämäkin, hekin, itselläkin, mekin, minunkin, muissakin, muitakin, muutaki
- PROPN: Alanyassakin, Chopiniakin, HPK:ssakin, noradrenaliinaakin
- SCONJ: joskin
- VERB-Fin: kuuluukin, Käyttäisinkin, Luulisikin, Otankin, kunnioittikin, kävikin, luulinkin, opinkin, syöttävätkin, vaikuttikin
- VERB-Inf: lopahtaakin
- VERB-Part: jaksanutkin
- Ko
- ADV: Mitenkä, Paljonko
- AUX-Fin: onko, eikö, Oletko, Oliko, Olisko, Ootko, Pitäisikö, Voiko, Voisko, liekö
- PRON: Mistäkö
- VERB-Fin: kiinnostaako, Kasvanko, Luulitko, Löysitkö, Rakensitko, Saako, Saitko, Satutko, Tarvitseeko, Tekikö
- Pa
- ADV: melkeinpä, siksipä, melkeimpä
- AUX-Fin: Enpä, eipä, olenpa, voipi
- PRON: sepä
- VERB-Fin: Esitänpä, Pitääpä, pääsevätpä
- S
- PRON: Mitäs, kukas
- Han
- Connegative
- Yes
- AUX-Fin: ole, voi, olisi, tarvitse, oo, olla, pidä, voida
- VERB-Fin: tule, halua, jaksa, saa, kestä, pysty, tiedä, kiinnosta, muista, anneta
- Yes
- Derivation
- Inen
- ADJ: ensimmäinen, toinen, limainen, viimeisen, Sentraalisen, ensimmäistä, punainen, entistä, erityisen, hirmuisen
- PRON: Toinen, toiseen
- Inen,Vs
- NOUN: limaisuutta, Hiljaisuuden, Tulevaisuuden, hiljaisuus, kokonaisuudessaan, kokonaisuuteen, mausteisuus, musikaalisuuden, ominaisuuksia, salaisuus
- Ja
- NOUN: Vierailija, valvojan, jakajan, käyttäjä, unennäkijä, Kuntatyöntekijä, Liikkujan, NAISKAMPAAMOTYÖNTEKIJÄIN, NBA-pelaajien, Osallistujat
- Lainen
- ADJ: tuollainen, jonkinlainen, sellainen, sellaisen, sellaista, suomalaisia, tietynlainen, tällaisia, Kaikenlainen, Suomalaisille
- NOUN: Eteläafrikkalaiset, Nokialaisten, PERUS-SUOMALAISTEN, Venäläisiä, Yövuorolaisena, ammattilainen, ammattilaisten, australialaisilla, humalaiset, juutalaisten
- PROPN: @Lukiolaiset
- Llinen
- ADJ: rauhallinen, asiallinen, kiitollinen, lapsiystävällinen, mahd., mahdollisen, pakolliset, rauhallista, surullista, Asillainen
- Llinen,Vs
- NOUN: liikenneturvallisuutta, mahdollisuus, voittomahdollisuuksista, Kirjallisuus, laadullisuus, liikenneturvallisuuteen, mahdollisuuksia, merkkiuskollisuutta, toiminnallisuuden, turvallisuuden
- Minen
- NOUN: #johtaminen, hapettuminen, osaaminen, tanssimista, tekemistä, #kuluttaminen, Haukkumista, Kirjoitaminen, Korvaaminen, Kustannustoimittaminen
- Sti
- ADV: runsaasti, nopeasti, helposti, tietysti, välittömästi, asiallisesti, kohtalaisesti, Hemodynaamisesti, huomattavasti, huonosti
- Ton
- ADJ: mahdoton, tuntemattomien, Asunnottomista, Kiireetön, Sanattomaan, Uskomatonta, Välitön, armoton, asumatonta, elämättömän
- Ton,Vs
- NOUN: hoitamattomuus
- Ttain
- ADV: erittäin, hiljattain, nimittäin, päivittäin, sykäyksittäin, vuosittain
- U
- NOUN: hapetus, loppuun, hapetuksen, avulla, tuoksu, Palvelu, apua, keskustelu, lämpöilyä, näkyä
- Vs
- NOUN: rakkauden, Viisauden, hapokkuus, käännösoikeudet, pituutta, #peliriippuvuus, Kauneus, Peliriippuvuudesta, Rakkaus, Saatavuus
- Inen
- Foreign
- Yes
- PROPN: Opamoxia
- X: LIST, All, Inclusive, author, baimbai, quote, time, #nature, Nix, pekato
- Yes
- InfForm
- 1
- AUX-Inf: olla, joutua, pitää
- NOUN-Inf: kumarrella
- VERB-Inf: saada, tehdä, tulla, pitää, mennä, nähdä, ottaa, alkaa, antaa, jättää
- 2
- AUX-Inf: ollessa, ollessaan
- VERB-Inf: nukkuessa, tullessa, istuen, nähdessään, valitessa, Huomatessaan, Käännettäessä, Nukkuessaan, Soidessa, Uneksiessasi
- 3
- AUX-Inf: olemaan
- VERB-Inf: katsomassa, laskemaan, käymään, menossa, tekemään, katsomaan, nostamaan, tietämään, vähentämään, auttamaan
- 1
- PartForm
- Agt
- VERB-Part: jättämäni, kirjoittama, tarvitsema, viemää, esittämä, harjoittama, ideoima, itsetekemä, jättämät, kertomani
- Past
- AUX-Part: ollut, jouduttu, olleet, voinut, joutunut, ollet, ollu, tainnut, tarvinnut, täytynyt
- VERB-Part: saanut, aloitettu, laitettu, päästy, vaihdettu, käynyt, nukkunut, lopetettu, nostettu, tehty
- Pres
- ADJ-Part: tulevaan
- AUX-Part: olevan, olevansa, oltava
- VERB-Part: edistäviin, koskevat, liittyvistä, näkyvissä, tapahtuvaa, ymmärtävän, aiheutuvat, alentavaa, arvostavan, auttavan
- Agt
- Person[psor]
- 1
- ADJ: kaltaiseni
- ADP: luotani
- ADV: piruuttani, itelläni, kimppuuni, vieressäni
- NOUN: elämäni, poikani, elämästäni, mielestäni, mieltäni, poikaani, päässäni, sieluni, silmiini, viisauteni
- PRON: itseni, itsemme, itsestäni, itseäni, toisemme, toisiamme
- VERB-Inf: muistaakseni, herättääkseeni, kirjoittaessani, käsittääkseni, pyrähtäessäni, suorittamastanne, tietääkseni, ymmärtääkseni
- VERB-Part: jättämäni, kertomani, kuuluvani, löytäväni, merkkaamamme, postanneeni, saavani
- 2
- ADV: kanssasi
- NOUN: elämäsi, Uskonne, asunnossasi, kohtalosi, kuolemaasi, kuvitelmissasi, kuvitelmissasihan, maksaasi, mt-ongelmiisi, muistoosi
- VERB: Uneksiessasi, halutessasi, käyttäessäsi, mielellänne, sanovasi, twiittaamasi, uidessasi, veljesi
- VERB-Inf: Uneksiessasi, halutessasi, käyttäessäsi, uidessasi
- VERB-Part: sanovasi, twiittaamasi
- 3
- ADJ: omiaan
- ADP: keskuudestaan, ympärillään
- ADV: alleen, lävitseen, mukanaan, sisällään, muuassaan
- AUX-Inf: ollessaan
- AUX-Part: olevansa
- NOUN: silmiään, aikansa, hetkensä, isällään, kantensa, silmänsä, @YouTube-soittolistaan, Pohjistaan, alansa, albuminsa
- PRON: itsensä, itselleen, itsestään, toisensa, itseensä, itseään, toisiinsa
- VERB-Inf: nähdessään, Huomatessaan, Nukkuessaan, auttaakseen, hämätäkseen, koittaessaan, lukiessaan, lähtiessään, pitääkseen, säilyäkseen
- VERB-Part: saatuaan, avattuaan, herättyään, kuolevansa, löytävänsä, oltuaan, rukoiltuaan
- 1
- Style
- Arch
- NOUN: NAISKAMPAAMOTYÖNTEKIJÄIN
- Coll
- ADJ: Ko-operoiva, co-operoiva, ekan, ilonen, jes, tuuheet, tällasia, vastaavaa
- ADP: kaa, luon
- ADV: ok, sit, ny, Koton, Miks, Mite, Plus, Viel, aluks, huome
- AUX-Fin: oon, oli, oo, Ootko, ei, olis, on
- AUX-Part: ollu
- CCONJ: mut
- INTJ: katos, perskeles, sori
- NOUN: #pesis, Eksä, Vierotusta, isällää, kattominen, kropassa, nauhotusta, parikertaa, peeärrää, puheenaihett
- PRON: mä, tää, mua, mulla, jotenki, mun, ton, varsinki, Sulla, itsarin
- PROPN: PERSUILLE, Persujen, instusta, stadis
- SCONJ: ku, et
- VERB-Fin: lähen, meen, Käytiin, alko, katoin, kutsuttais, kysy, lähdettiin, läpäistiin, löys
- VERB-Inf: Tubettaa, ehottaa, kattoo, seurusteleen, tonkiin, vetään
- VERB-Part: eksytty, innostunu, kaivannu, kasvanu, opettanu, oppinu, ostanu, ottanu, päässy, testattavaks
- Arch
- Typo
- Yes
- ADJ: Asillainen, Asilliallinen, Oitkä, Pitän, harkinnanvaraisen, huvittavaa, jonkilainen, kevyessa, rauhalline, sisinisilmäinen
- ADP: läelle, vaste
- ADV: Enemmin, hijalleen, jol-loin, kunnon, milei, myö, vaam, melkeimpä, passii-visesti
- AUX-Fin: eii, n, olisisi
- AUX-Part: ollet
- CCONJ: Saatika
- NOUN: 800eur/kk, 2-luumen, Bipaille, C, Diureesii, Kateri, Potilan, SAÖ2, ahven.net, aviolitto
- NUM: 100.n
- PRON: sen
- PROPN: @SuomenPankki, Actrpid-, Drouhin, Fureisi, Noradrenaliina, Noradrenalinan, OIkkosen, Seenasen, instusta, noradrenaliinaakin
- PUNCT: 8
- VERB-Fin: Antauden, Happeutui, Satuoi, käysi, liikutta, muttuu, osaisen, osaisin, päädy-tään, soputuu
- VERB-Inf: sallita
- VERB-Part: kiinnostavaa, laitettu, saaatu, twiittaamasi, vahennelty
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: olla.
- This corpus uses 10 lemmas as auxiliaries (aux). Examples: ei, olla, voida, pitää, joutua, taitaa, saattaa, tarvita, täytyä, mahtaa.
- This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: olla.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Gen (3)
- VERB-Fin--NOUN-Nom (353)
- VERB-Fin--NOUN-Par (27)
- VERB-Fin--PRON-Gen (3)
- VERB-Fin--PRON-Nom (131)
- VERB-Fin--PRON-Par (6)
- VERB-Inf--NOUN-Ess (1)
- VERB-Inf--NOUN-Gen (12)
- VERB-Inf--NOUN-Nom (24)
- VERB-Inf--NOUN-Par (7)
- VERB-Inf--PRON-Gen (8)
- VERB-Inf--PRON-Nom (7)
- VERB-Inf--PRON-Par (6)
- VERB-Part--NOUN-Gen (24)
- VERB-Part--NOUN-Nom (107)
- VERB-Part--NOUN-Par (11)
- VERB-Part--PRON-Gen (13)
- VERB-Part--PRON-Nom (21)
- obj
- VERB--NOUN-Par (1)
- VERB-Fin--NOUN-Ela (1)
- VERB-Fin--NOUN-Gen (100)
- VERB-Fin--NOUN-Ill (1)
- VERB-Fin--NOUN-Nom (65)
- VERB-Fin--NOUN-Par (195)
- VERB-Fin--PRON-Acc (8)
- VERB-Fin--PRON-Gen (13)
- VERB-Fin--PRON-Nom (13)
- VERB-Fin--PRON-Par (48)
- VERB-Inf--NOUN-Ela (1)
- VERB-Inf--NOUN-Gen (29)
- VERB-Inf--NOUN-Nom (38)
- VERB-Inf--NOUN-Par (128)
- VERB-Inf--PRON-Gen (6)
- VERB-Inf--PRON-Nom (4)
- VERB-Inf--PRON-Par (21)
- VERB-Inf--PRON-Par-ADP(kohtaan) (1)
- VERB-Part--NOUN-Ela (1)
- VERB-Part--NOUN-Gen (25)
- VERB-Part--NOUN-Nom (70)
- VERB-Part--NOUN-Par (107)
- VERB-Part--PRON-Gen (2)
- VERB-Part--PRON-Nom (9)
- VERB-Part--PRON-Par (15)
Verbs with Reflexive Core Objects
- This corpus contains 6 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: esitellä itsensä, koskea itseään, kuristaa itsensä, saada itseäni, treenata itsensä, väsyttää itsensä
Relations Overview
- This corpus uses 15 relation subtypes: acl:relcl, aux:pass, cc:preconj, compound:nn, compound:prt, cop:own, csubj:cop, flat:foreign, flat:name, nmod:gobj, nmod:gsubj, nmod:poss, nsubj:cop, nsubj:outer, xcomp:ds
- The following 5 relation types are not used in this corpus at all: iobj, expl, clf, list, reparandum