UD Slovak SNK
Language: Slovak (code: sk
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v1.4 release.
The following people have contributed to making this treebank part of UD: Katarína Gajdošová, Mária Šimková, Daniel Zeman.
Repository: UD_Slovak-SNK
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: fiction, nonfiction, news
Questions, comments? General annotation questions (either Slovak-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeman (æt) ufal • mff • cuni • cz]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Slovak UD treebank is based on data originally annotated as part of the Slovak National Corpus, following the annotation style of the Prague Dependency Treebank.
Slovak Dependency Treebank (Slovenský závislostný korpus) was created as part of the Slovak National Corpus at the Ľ. Štúr Institute of the Slovak Academy of Sciences. The original annotation follows the guidelines of the Prague Dependency Treebank (Czech), slightly modified in the spirit of Slovak grammatical tradition. Morphological tags, lemmas and dependency relations have been assigned manually to every word.
The present dataset is a subset of the original treebank. We automatically selected the sentences where the two human annotators 100% agreed on the analysis. This increases the quality and trustworthiness of the data but it also results in selecting short sentences most of the time. An extended version may be published in the future when manually merged and checked annotation is available.
This subset annotated in the original PDT-like style is available separately, see http://hdl.handle.net/11234/1-1822 and cite as
Gajdošová, Katarína; Šimková, Mária et al., 2016, Slovak Dependency Treebank, LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11234/1-1822.
UD_Slovak contains the same data with annotation converted to conform to the Universal Dependencies guidelines. The original treebank was prepared by a team led by Katarína Gajdošová and Mária Šimková. Selection of sentences for this subset and conversion to Universal Dependencies was done by Dan Zeman.
References
- Daniel Zeman (2017): Slovak Dependency Treebank in Universal Dependencies. In: Jazykovedný časopis / Journal of Linguistics, ISSN 0021-5597, vol. 68, no. 2, pp. 385-395
Acknowledgments
Statistics of UD Slovak SNK
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – Animacy – Aspect – Case – ConjType – Degree – Foreign – Gender – Gender[psor] – Hyph – Mood – Number – Number[psor] – NumForm – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – det – det:numgov – discourse – expl:pass – expl:pv – fixed – flat – flat:foreign – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – obl:arg – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 10604 sentences, 106043 tokens and 106097 syntactic words.
- This corpus contains 17859 tokens (17%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus does not contain words that contain both letters and punctuation.
- This corpus contains 54 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 9 types of multi-word tokens. Examples: naňho, naň, doň, preňho, doňho, uňho, oňho, poňho, zaňho.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 145 word types tagged as particles (PART): Ako, Ano, Beztak, Bohužiaľ, Chvalabohu, Dobre, Ešteže, Fajn, Horkýže, Isteže, Kdeže, Kiež, Lenže, Lúčne, Mimochodom, Možnože, Namojdušu, Nanešťastie, Nech, Niežeby, Nijako, Nože, Nuž, Obzvlášť, Pomóóóc, Práveže, Reku, Skrátka, Snáď, Správne, Super, TUŠÍM, Takisto, Taktiež, Takže, Ticho, Tuším, Vcelku, Veruže, Vážne, a, aj, akiste, akurát, ale, ani, asi, aspoň, až, bezpochyby, celkom, div, dokonca, doslova, dosť, ešte, hlavne, hneď, hádam, i, iba, inak, iste, jedine, jednoducho, keď, koncov, konečne, len, možno, najmenej, najmä, nakoniec, naopak, naozaj, napodiv, napokon, napríklad, naviac, navyše, našťastie, nie, nič, no, náhodou, pekne, pochopiteľne, pomerne, poprípade, pravda, pravdaže, pravdepodobne, pravdpodobne, predovšetkým, predsa, presne, priam, približne, prinajmenšom, prirodzene, prosím, práve, radšej, respektíve, rozhodne, samozrejme, skoro, skôr, sotva, stále, síce, tak, takmer, takpovediac, tam, teda, tiež, to, totiž, toto, tu, určite, už, vari, veru, veď, vlastne, vonkoncom, vraj, vskutku, vôbec, výlučne, však, zasa, zase, zhruba, zo, zrejme, áno, údajne, čo, čoraz, Škoda, že, žiaľ
- This corpus contains 29 lemmas tagged as pronouns (PRON): ja, kto, ktokoľvek, ktosi, ktože, mama, my, málokto, niekto, niečo, nik, nikto, nič, on, ona, ono, sa, seba, si, ty, veselý, vy, všeličo, všetko, za, čo, čokoľvek, čosi, čože
- This corpus contains 51 lemmas tagged as determiners (DET): aký, akýkoľvek, akýsi, dajaký, hociktorý, ich, iný, istý, jeho, jej, kadejaký, každý, koľko, ktorý, ktorýkoľvek, ktorýsi, môj, nejaký, niekolko, niekoľko, niekoľký, niektorý, nijaký, náš, onaký, podaktorý, samý, svoj, sám, ta, taktýto, takéto, taký, takýto, tamten, ten, tento, to, toto, toľko, tvoj, tá, táto, týmto, váš, všakovaký, všelijaký, všetok, čísi, žiaden, žiadny
- This corpus contains 3 lemmas tagged as auxiliaries (AUX): by, byť, bývať
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: byť, bývať
- There are 4 (de)verbal forms:
- Conv
- VERB: cítiac, Hľadajúc, Nehovoriac, Zostupujúc, bežiac, kašlúc, kľajúc, lapajúc, ležiac, listujúc
- Fin
- AUX: som, je, sme, sú, bude, si, ste, budú, nebude, budeme
- VERB: je, má, ide, môže, mám, majú, musí, musím, sú, chcem
- Inf
- AUX: byť
- VERB: povedať, mať, ísť, podporovať, robiť, stať, venovať, pokračovať, hľadať, stáť
- Part
- ADJ: nasledujúcich, nasledujúci, ozbrojených, sledovaných, zmätený, Zhlúpnutý, nájdené, otvorené, pripravená, pripravený
- AUX: bol, bola, bolo, boli, nebola, nebolo, nebol, neboli, býval, bývali
- VERB: mal, povedal, povedala, mala, bol, bolo, bola, odvetil, spýtal, odvetila
Nominal Features
- Fem
- ADJ: druhej, veľkej, prvá, slovenskej, verejných, štátnej, Makovej, európskej, prvej, veľkú
- ADJ-Part: ozbrojených, sledovaných, pripravená, nasledujúcej, poranenú, presvedčená, určená, uvedenej, vynikajúcu, Lietajúca
- AUX-Part: bola, boli, nebola, neboli, bývali, bývala
- DET: jeho, ktorá, jej, ktoré, tejto, svojej, tá, táto, ich, tej
- NOUN: vláda, chvíľu, mama, tvár, oblasti, vlády, chvíli, ruku, časť, izby
- NUM: dve, jednej, jedna, jednou, jednu, tri, dvoch, obe, troch, obidvoch
- PRON: ju, jej, nej, ona, ňou, ich, ňu, nich, im, ne
- PROPN: Maja, Lori, Jazmína, Blythe, Amy, Marga, Irma, Maju, Makulienka, Delina
- VERB-Fin: žiada
- VERB-Part: povedala, mala, bola, odvetila, zvolala, spýtala, chcela, začala, nemala, pozrela
- Masc
- ADJ: celý, prvý, druhý, veľký, ďalší, nový, veľkého, jediný, prvým, nového
- ADJ-Part: nasledujúci, zmätený, Zhlúpnutý, pripravený, zatajeným, zhrozený, nasledujúcich, obkľúčený, očakávaný, spojených
- ADV: raz, ráz, razy
- AUX-Part: bol, boli, nebol, neboli, býval, bývali
- DET: ktorý, jeho, ten, jej, môj, tento, každý, ktoré, všetci, ktorí
- NOUN: roku, deň, rokov, ľudí, život, života, rokoch, čas, človek, pocit
- NUM: jeden, dva, jedného, obaja, tri, dvoch, jedným, štyri, dvaja, jednom
- PRON: ho, mu, ich, neho, im, kto, nich, ním, nikto, on
- PROPN: Chris, Winston, Aladin, Mauglí, Vilko, Herkules, Abu, Bush, Baghíra, Ferdo
- VERB: mal, povedal, bol, odvetil, spýtal, začal, stal, chcel, prišiel, vedel
- VERB-Part: mal, povedal, bol, odvetil, spýtal, začal, stal, chcel, prišiel, vedel
- Neut
- ADJ: veľké, celé, ľudské, možné, ďalšie, známe, jasné, nové, prvé, malé
- ADJ-Part: chránených, otvorené, rozdelené, nasledujúcich, nazývané, neočakávané, ohrozené, orientované, pozorované, sledovanom
- AUX-Part: bolo, nebolo, boli
- DET: to, jeho, toho, všetko, ktoré, tom, tomu, toto, jej, svoje
- NOUN: oči, storočia, meno, deti, miesto, obdobie, mesta, slová, svetlo, slovo
- NUM: veľa, jedno, mnoho, päť, zopár, trochu, viac, desať, dvadsať, viacero
- PRON: čo, niečo, nič, ho, ich, čosi, ňom, nich, čím, všetko
- PROPN: Uhorska, Slovensku, Nemecka, Nemecku, Nemecko, Slovenska, Slovensko, Slnka, Slnko, Talianska
- VERB-Part: bolo, stalo, malo, podarilo, došlo, nestalo, zdalo, trvalo, išlo, napadlo
- Anim
- ADJ: prvý, mladý, veľký, ostatní, rád, prvým, svätého, veľkého, mŕtvi, ďalší
- ADJ-Part: zmätený, Zhlúpnutý, zhrozený, pripravený, spomínaní, zvyknutí, Zamilovaný, inaugurovaný, nezaradených, oblečený
- AUX-Part: bol, boli, nebol, býval, neboli
- DET: ktorý, jeho, všetci, ktorí, ten, sám, každý, všetkých, jej, ktorého
- NOUN: ľudí, človek, otec, ľudia, muž, kráľ, sultán, otca, človeka, cisár
- NUM: obaja, jeden, dvaja, dvoch, mnohí, obidvoch, jedným, troch, jedného, jednému
- PRON: ho, mu, neho, ich, im, kto, nikto, on, ním, nich
- PROPN: Chris, Winston, Aladin, Mauglí, Vilko, Herkules, Abu, Bush, Baghíra, Ferdo
- VERB-Part: mal, povedal, odvetil, bol, spýtal, chcel, vedel, začal, dal, zvolal
- Inan
- ADJ: celý, druhý, prvý, veľký, nový, ďalší, nového, veľkého, posledný, tretí
- ADJ-Part: nasledujúci, zatajeným, nasledujúcich, očakávaný, spojených, založený, adresovaný, nakrútené, nájdené, obkľúčený
- ADV: raz, ráz, razy
- AUX-Part: bol, boli, neboli, nebol, bývali
- DET: ktorý, jeho, ten, jej, ktoré, tento, môj, tohto, tom, ich
- NOUN: roku, deň, rokov, život, života, rokoch, čas, pocit, pohľad, sveta
- NUM: dva, jeden, tri, jedného, štyri, jednom, jedným, miliónov, dvoch, oboch
- PRON: ho, ich, neho, nich, ňom, ním, nemu, nimi, im, ne
- PROPN: Iraku, Mesiac, Novgorode, Ríma, Egypt, Mesiaca, Mesiaci, Paríža, Python, Sírius
- VERB: bol, mal, vznikol, zaznel, boli, nastal, prišiel, zmocnil, stal, začal
- VERB-Part: bol, mal, vznikol, zaznel, boli, nastal, prišiel, zmocnil, stal, začal
- Plur
- ADJ: ďalšie, verejných, nové, rôznych, nových, veľké, ďalších, hlavných, jednotlivých, legislatívne
- ADJ-Part: nasledujúcich, ozbrojených, sledovaných, nájdené, uvedených, chránených, odložené, spojených, spomínaní, týkajúcich
- ADV: ráz, razy
- AUX-Fin: sme, sú, ste, budú, budeme, budete, buďte, Buďme, Nebudete, nebudeme
- AUX-Part: boli, neboli, bývali
- DET: ktoré, jeho, všetky, všetci, všetkých, tieto, ktorí, svojich, ich, tie
- NOUN: oči, rokov, ľudí, rokoch, deti, dvere, ľudia, slová, nohy, podmienky
- NUM: dva, tri, dve, dvoch, obaja, štyri, troch, obidvoch, oboch, dvaja
- PRON: ich, nás, nich, im, nám, vás, nimi, my, vám, vy
- PROPN: Peržanov, Vianoce, Benátok, Samojedov, Slovania, Slovákov, Arabi, Arabmi, Estóncov, Grékov
- VERB-Fin: majú, sú, máme, môžu, máte, môžeme, počkajte, vyparia, chcete, musíme
- VERB-Part: mali, mohli, boli, prišli, začali, sedeli, dali, dostali, išli, chceli
- Sing
- ADJ: celý, prvý, druhý, veľký, druhej, veľkého, nový, veľkej, prvá, slovenskej
- ADJ-Part: nasledujúci, zmätený, Zhlúpnutý, pripravená, pripravený, zatajeným, zhrozený, nasledujúcej, nazývaného, obkľúčený
- ADV: raz
- AUX-Fin: som, je, bude, si, nebude, budem, budeš, nebudem, Nebuď, býva
- AUX-Part: bol, bola, bolo, nebola, nebolo, nebol, býval, bývala
- DET: to, jeho, ktorý, jej, ten, ktorá, tom, toho, ich, všetko
- NOUN: roku, vláda, chvíľu, deň, mama, tvár, život, života, storočia, chvíli
- NUM: jeden, jedného, jednej, veľa, jedna, jedno, mnoho, jednou, jednu, jedným
- PRON: mi, ho, ma, mu, čo, ju, ja, jej, niečo, nič
- PROPN: Maja, Chris, Winston, Aladin, Mauglí, Lori, Jazmína, Vilko, Blythe, Herkules
- VERB-Fin: je, má, ide, môže, mám, musí, musím, chcem, neviem, znamená
- VERB-Part: mal, povedal, povedala, mala, bol, bolo, bola, odvetil, spýtal, odvetila
- Acc
- ADJ: druhý, celý, ďalšie, prvý, celé, nové, veľkú, veľké, veľký, novú
- ADJ-Part: nasledujúci, odložené, poranenú, vynikajúcu, nakrútené, nezaradených, obľúbené, orientované, pozorovanú, požehnané
- ADP: na, o, za, pre, v, cez, medzi, po, pod, nad
- ADV: raz, razy
- DET: to, svoje, jeho, ten, jej, ktoré, ktorú, svoju, tú, všetky
- NOUN: chvíľu, deň, oči, ruku, hlavu, tvár, život, pohľad, zem, čas
- NUM: dva, tri, dve, jeden, jednu, veľa, jedno, štyri, mnoho, zopár
- PRON: ho, ma, ju, ich, čo, niečo, nič, mňa, ťa, neho
- PROPN: Chrisa, Maju, Winstona, Aladina, Mauglího, Vilka, Briena, Lori, Margu, Jazmínu
- Dat
- ADJ: vlastným, mladým, Doležalovej, Hádovej, Zlej, cirkevnej, ostatným, starej, sultánovej, ďalším
- ADJ-Part: chýbajúcej, ležiacim, milovanému, nadržanému, nakloneným, namaľovaným, obohatenému, odmietanému, organizovanému, osvetlenému
- ADP: k, ku, proti, napriek, kvôli, vďaka, voči, oproti, naproti, ústreti
- DET: tomu, jeho, ktorému, svojmu, svojej, svojim, ich, tomuto, týmto, všetkým
- NOUN: mame, dverám, oknu, otcovi, koncu, stolu, kráľovi, moci, vojne, ľuďom
- NUM: trom, jednému, obom, mnohým, obidvom, piatim, siedmim
- PRON: mi, mu, jej, im, ti, mne, nám, vám, nemu, sebe
- PROPN: Maji, Winstonovi, Chrisovi, Júlii, Bohu, Irme, Lori, Vilkovi, Balúovi, Ferdovi
- Gen
- ADJ: verejných, veľkého, slovenskej, nového, cirkevného, európskej, veľkej, zahraničnej, celého, slovenského
- ADJ-Part: ozbrojených, chránených, nazývaného, spojených, týkajúcich, vybraných, zameraných, spomenutých, uvedenej, uvedených
- ADP: do, z, od, zo, podľa, okolo, bez, počas, u, okrem
- ADV: ráz
- DET: jeho, toho, tohto, ich, svojho, jej, ktorého, svojej, svojich, všetkých
- NOUN: roku, rokov, života, storočia, vlády, izby, sveta, dňa, mesta, politiky
- NUM: jedného, dvoch, jednej, miliónov, troch, obidvoch, oboch, viacerých, štyroch, desať
- PRON: nich, neho, seba, nej, mňa, nás, ma, jej, ich, teba
- PROPN: Uhorska, Ríma, Jána, Pavla, Zeme, Nemecka, Mesiaca, Paríža, Slovenska, Busha
- Ins
- ADJ: prvým, ďalším, veľkým, jediným, veľkými, ďalšou, hlavnou, najväčším, druhým, dôležitou
- ADJ-Part: zatajeným, otvorenými, predstieraným, prepracovaným, rotujúcim, rozžiareným, skríženými, uznávaným, vzdialenejšími, zmiešaným
- ADP: s, pred, so, za, medzi, pod, nad, spolu, nado, predo
- DET: jeho, tým, svojím, jej, svojou, ktorými, ktorou, ktorým, mojím, akousi
- NOUN: hlavou, cieľom, očami, plecami, súčasťou, úsmevom, chrbtom, rokmi, tvárou, vlasmi
- NUM: jednou, jedným, štyrmi, dvoma, mnohými, troma, oboma, desiatimi, deviatimi, dvomi
- PRON: ním, mnou, ňou, nimi, sebou, tebou, nami, čím, niečím, vami
- PROPN: Chrisom, Vilkom, Allenom, Euroáziou, Európou, Ginsbergom, Mesiacom, Rickom, Rudkom, Aladinom
- Loc
- ADJ: druhej, prvom, poslednom, druhom, poslednej, celom, nasledujúcich, sledovaných, starej, veľkej
- ADJ-Part: nasledujúcich, sledovaných, nasledujúcej, nasledujúcom, otrhaných, sledovanom, spomínanom, uvedených, vzdialenom, bežiacom
- ADP: v, na, po, o, pri, vo, popri, AN
- DET: tom, jeho, tejto, tomto, svojom, tej, jej, ktorom, svojej, ktorých
- NOUN: roku, rokoch, chvíli, čase, oblasti, noci, prípade, ceste, škole, izbe
- NUM: jednej, jednom, dvoch, oboch, mnohých, obidvoch, pol, troch, štyroch, desiatich
- PRON: nej, ňom, sebe, mne, nich, čom, tebe, vás, kom, ničom
- PROPN: Iraku, Novgorode, Slovensku, Európe, Mesiaci, Nemecku, Zemi, Jene, Prahe, Rusi
- Nom
- ADJ: prvý, veľký, prvá, ďalšie, možné, veľká, známe, ďalší, celý, jediný
- ADJ-Part: zmätený, Zhlúpnutý, nájdené, pripravená, pripravený, zhrozený, obkľúčený, otvorené, pozorované, presvedčená
- ADV: raz
- DET: to, jeho, ktoré, ktorý, ktorá, jej, ten, všetci, tá, táto
- NOUN: vláda, mama, človek, otec, ľudia, muž, tvár, kráľ, sultán, deti
- NUM: jeden, jedna, obaja, tri, veľa, dvaja, dve, štyri, dva, jedno
- PRON: ja, čo, ty, kto, ona, nikto, on, niečo, nič, my
- PROPN: Maja, Chris, Winston, Aladin, Mauglí, Jazmína, Vilko, Herkules, Abu, Bush
- Voc
- NOUN: mami, slečna, chlapče, ocko, Soľ, drahý, džin, pane, priatelia, priateľko
- PROPN: Winston, Baghíra, Džafar, Pane, Abubu, Ali, Bože, Jago, Ježiši, Kerchak
Degree and Polarity
- Cmp
- ADJ: lepšie, radšej, starší, vyšších, väčšie, lepšiu, mladší, staršia, väčší, Dôležitejším
- ADJ-Part: vzdialenejšími, prekvapujúcejšia, umiernenejšiu
- ADV: viac, bližšie, dlhšie, menej, vyššie, silnejšie, neskôr, nižšie, ľahšie, dávnejšie
- Pos
- ADJ: celý, ďalšie, veľký, nové, veľkého, veľké, ďalší, nový, verejných, celé
- ADJ-Part: nasledujúcich, nasledujúci, ozbrojených, sledovaných, zmätený, Zhlúpnutý, nájdené, otvorené, pripravená, pripravený
- ADV: veľmi, potom, opäť, teraz, už, stále, dnes, neskôr, dobre, napokon
- Sup
- ADJ: najväčším, najlepšie, najradšej, najväčšie, najvýznamnejších, najdôležitejšie, najlepšia, najlepší, najmenšie, najväčšou
- ADJ-Part: najobľúbenejšími, najuznávanejší
- ADV: najlepšie, najviac, najčastejšie, najrýchlejšie, najskôr, Najdivokejšie, najsilnejšie, Najhoršie, Najvýraznejšie, najdlhšie
- Neg
- ADJ-Part: neočakávané, nezaradených, Nepíšuci, nedisponujúca, nedovolené, nekontaminovaných, nekrytú, nekrytými, neobmedzeným, neplánovaný
- AUX-Fin: je, nebude, sú, nebudem, som, Nebudete, Nebuď, nebudeme, nebudeš, nebudú
- AUX-Part: nebola, nebolo, nebol, neboli
- VERB-Conv: Nehovoriac
- VERB-Fin: neviem, nemám, nemá, nemôžem, je, nemôže, nemôžeš, nevie, nezáleží, niet
- VERB-Inf: nebyť, neprovokovať, Nevidieť, nemyslieť, neplytvať, nepotrebovať, neprekročiť, nespomenúť, neupútať, nevytrúsiť
- VERB-Part: nemal, nemala, nemohla, nevidel, nevedel, nechcela, nepovedal, nestalo, nemohol, nevidela
- Pos
- ADJ-Part: nasledujúcich, nasledujúci, ozbrojených, sledovaných, zmätený, Zhlúpnutý, nájdené, otvorené, pripravená, pripravený
- AUX-Fin: som, je, sme, sú, bude, si, ste, budú, budeme, budem
- AUX-Inf: byť
- AUX-Part: bol, bola, bolo, boli, býval, bývali, bývala
- VERB: mal, povedal, je, povedala, má, mala, bol, bolo, ide, bola
- VERB-Conv: cítiac, Hľadajúc, Zostupujúc, bežiac, kašlúc, kľajúc, lapajúc, ležiac, listujúc, odhliadnuc
- VERB-Fin: je, má, ide, môže, mám, majú, musí, musím, sú, chcem
- VERB-Inf: povedať, mať, ísť, podporovať, robiť, stať, venovať, pokračovať, hľadať, stáť
- VERB-Part: mal, povedal, povedala, mala, bol, bolo, bola, odvetil, spýtal, odvetila
Verbal Features
- Imp
- AUX-Fin: som, je, sme, sú, bude, si, ste, budú, nebude, budeme
- AUX-Inf: byť
- AUX-Part: bol, bola, bolo, boli, nebola, nebolo, nebol, neboli, býval, bývali
- VERB: mal, je, má, mala, bol, bolo, ide, bola, môže, mali
- VERB-Conv: cítiac, Hľadajúc, Nehovoriac, Zostupujúc, bežiac, kašlúc, kľajúc, lapajúc, ležiac, listujúc
- VERB-Fin: je, má, ide, môže, mám, majú, musí, musím, sú, chcem
- VERB-Inf: mať, ísť, podporovať, robiť, pokračovať, hľadať, stáť, veriť, byť, spať
- VERB-Part: mal, mala, bol, bolo, bola, mali, chcel, vedel, chcela, mohol
- Imp,Perf
- VERB-Fin: dá, daj, Počuješ, nedá, poznám, reaguje, realizuje, venuje, dám, nedajú
- VERB-Inf: venovať, dať, počuť, identifikovať, korunovať, reagovať, odpovedať, publikovať, realizovať, definovať
- VERB-Part: dal, počul, dali, venoval, dala, stačilo, neodpovedal, odpovedala, poznal, poznala
- Perf
- VERB-Conv: odhliadnuc, povediac, vyhovejúc, využijúc
- VERB-Fin: pripraví, vytvorí, pozri, zabezpečí, počkajte, prijme, príde, vyparia, podporí, počkaj
- VERB-Inf: povedať, stať, odísť, ostať, prísť, vysvetliť, vytvoriť, pomôcť, urobiť, zastaviť
- VERB-Part: povedal, povedala, odvetil, spýtal, odvetila, zvolala, začal, stal, prišiel, spýtala
- Cnd
- ADV: akoby
- AUX: by
- PART: Niežeby
- SCONJ: aby, keby, akoby
- Imp
- AUX-Fin: buďte, Buďme, Nebuď
- VERB-Fin: pozri, poď, počkajte, počkaj, Prestaň, daj, nerob, pustite, čujte, Dotkni
- Ind
- AUX-Fin: som, je, sme, sú, bude, si, ste, budú, nebude, budeme
- VERB-Fin: je, má, ide, môže, mám, majú, musí, musím, sú, chcem
- Fut
- AUX-Fin: bude, budú, nebude, budeme, budem, budeš, nebudem, budete, Nebudete, nebudeme
- VERB-Fin: bude, pôjdeme, nebudú, pôjdem, pôjde, Poletím, Poletíš, budem, budeš, budú
- Past
- AUX-Part: bol, bola, bolo, boli, nebola, nebolo, nebol, neboli, býval, bývali
- VERB-Part: mal, povedal, povedala, mala, bol, bolo, bola, odvetil, spýtal, odvetila
- Pres
- AUX-Fin: som, je, sme, sú, si, ste, býva, nebýva, niesme, so
- VERB-Fin: je, má, ide, môže, mám, majú, musí, musím, sú, chcem
- Act
- ADJ-Part: nasledujúcich, nasledujúci, nasledujúcej, týkajúcich, Lietajúca, krútiace, nasledujúcom, predchádzajúce, predsedajúci, provokujúce
- Pass
- ADJ-Part: ozbrojených, sledovaných, zmätený, Zhlúpnutý, nájdené, otvorené, pripravená, pripravený, uvedených, zatajeným
Pronouns, Determiners, Quantifiers
- Dem
- ADV: tu, tam, tak, vtedy, takto, preto, zatiaľ, sem, dovtedy, odvtedy
- DET: to, ten, tom, toho, tomu, tejto, toto, tento, tohto, tieto
- Emp
- DET: sám, sama, samé, sami, samo, samom, samej, samého, samých, samým
- Ind
- ADV: niekedy, niekde, kedysi, inak, niekoľkokrát, akosi, kdesi, inde, inokedy, nejako
- DET: niekoľko, iné, nejaký, niektoré, akýsi, iných, nejaké, niekoľkých, niektorých, iný
- PRON: niečo, niekto, čosi, ktosi, niečím, všeličo, čokoľvek, niekoho, niečoho, ktokoľvek
- Int,Rel
- ADV: kde, ako, prečo, kam, kedy, odkiaľ, odkedy, čím, Kamže, kadiaľ
- DET: ktoré, ktorý, ktorá, ktorí, ktorú, ktorého, ktorej, ktorých, ktorom, aké
- PRON: čo, kto, čím, čom, koho, Čože, čomu, komu, ktože, čoho
- Neg
- ADV: nikdy, nijako, nikam, nikde
- DET: nijaké, žiadne, nijaký, nijaká, nijakú, žiaden, žiadna, nijakej, nijakého, žiadneho
- PRON: nič, nikto, nik, nikoho, nikomu, ničoho, ničom, ničomu
- Prs
- DET: jeho, jej, ich, svoje, svojej, môj, svojho, svojich, svoju, moja
- PRON: sa, si, mi, ho, ma, mu, ju, ja, jej, ich
- Tot
- ADV: vždy, všade, Všelijako
- DET: všetko, všetky, každý, všetci, všetkých, každom, každú, každé, všetkým, každého
- PRON: všetko, všetci, všetky, všetkých, všetku, všetkému
- Card
- DET: niekoľko, niekoľkých, toľko, koľko, niekoľkými, niekolko
- Mult
- ADJ: jediný, mnohých, jediného, jediným, jediné, mnohí, jediná, ostatní, dvojitý, dvojnásobné
- ADV: raz, prvýkrát, niekoľkokrát, neraz, dvakrát, Tisíckrát, dvojako, mnohokrát, ráz, stokrát
- Ord
- ADJ: prvý, druhý, druhej, prvé, prvá, prvom, prvým, prvej, druhá, tretí
- Yes
- DET: jeho, jej, ich, svoje, svojej, môj, svojho, svojich, svoju, moja
- Yes
- DET: svoje, svojej, svojho, svojich, svoju, svojom, svoj, svojím, svojou, svojim
- PRON: sa, si, seba, sebe, sebou, a, se, za
- 1
- AUX-Fin: som, sme, budeme, budem, nebudem, Buďme, nebudeme, niesme, so
- DET: môj, moja, moje, môjho, mojich, naše, náš, našej, mojej, moju
- PRON: mi, ma, ja, mňa, nás, mne, mnou, nám, my, nami
- VERB-Fin: mám, musím, chcem, neviem, máme, ďakujem, som, viem, nemám, nemôžem
- 2
- AUX-Fin: si, ste, budeš, budete, buďte, Nebudete, Nebuď, nebudeš
- DET: tvoj, vaše, tvoje, tvoja, tvojho, vaša, tvojím, vašej, vašu, Tvojej
- PRON: ťa, ty, ti, vás, vám, teba, vy, tebou, tebe, vami
- VERB-Fin: máš, chceš, si, pozri, máte, poď, musíš, nemôžeš, počkajte, chcete
- 3
- AUX-Fin: je, sú, bude, budú, nebude, býva, nebudú, nebýva
- DET: jeho, jej, ich
- PRON: ho, mu, ju, jej, ich, nich, im, nej, ním, ona
- VERB-Fin: je, má, ide, môže, majú, musí, sú, znamená, pripraví, vytvorí
- Fem
- DET: jej
- Masc,Neut
- DET: jeho, ich, jej
- Plur
- DET: ich, naše, našej, náš, nášho, našu, vaše, našich, našom, naša
- Sing
- DET: jeho, jej, môj, moja, moje, môjho, mojich, mojej, moju, tvoj
Other Features
- Abbr
- Yes
- ADV: napr, resp, cca
- PROPN: J, SR, USA, EÚ, P, A, N, V, B, C
- X: tzv, sv, km, r, c, č, kr, PhDr, prof, Dr
- Yes
- AdpType
- Prep
- ADP: na, v, do, s, z, o, po, za, k, od
- Voc
- ADP: vo, so, zo, ku, nado, odo, predo, bezo, podo
- Prep
- ConjType
- Oper
- SYM: +
- Oper
- Foreign
- Yes
- X: the, of, REUTERS, Energy, Evangelium, Film, Grazie, Harken, International, Lara
- Yes
- Hyph
- Yes
- ADV: mozno
- X: O, po, česko, San, rostovsko, v, KLIP, El, a, al
- Yes
- NumForm
- Digit
- NUM: II, 1, 11, 2, I, 2004, 4, 20, 10, III
- Digit
- Typo
- Yes
- ADJ: administratívnych, aténského, bielorusk0ho, dnešních, hororej, huslové, iní, mikrovlné, napísane, naznámejší
- ADJ-Part: napísane, pomenována, vládnúcej, vylučené, zachytený
- ADP: s, zo, AN, Po, ma, o, pomocu
- ADV: definitivne, jednostranné, natešne, neustála, niekdy, sebe, uz, vslatne
- AUX-Fin: niesme, so
- CCONJ: sice
- DET: svojim, ktorý, Ake, akí, do, ktorí, niekolko, svojím, tuto
- NOUN: básni, kliniec, koalícia, Odhlásenia, Princezny, Východiska, girladnami, grímasu, hierarcha, hlainy
- NUM: dva
- PART: Ano
- PRON: a, je, za
- PROPN: Winton, Rama
- VERB-Fin: Nepridátete, nezáhráte, obsakujú, pocitujú, považujú, presvedčia, prihovárá, tiahnú, trvrdia, zavrem
- VERB-Inf: presadzovť, čítal
- VERB-Part: Nevydeli, hlásli, nchýbal, odšuchatala, okazoval, oposkladali, pophyboval, poprisili, posilili, prejavil
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: byť, bývať.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: byť, by.
- This corpus uses 2 lemmas as passive auxiliaries (aux:pass). Examples: byť, bývať.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Gen (8)
- VERB-Fin--NOUN-Nom (902)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Nom (184)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Nom (58)
- VERB-Inf--PRON-Gen (1)
- VERB-Inf--PRON-Nom (3)
- VERB-Part--NOUN-Acc (10)
- VERB-Part--NOUN-Gen (11)
- VERB-Part--NOUN-Nom (2115)
- VERB-Part--PRON-Acc (3)
- VERB-Part--PRON-Nom (293)
- obj
- VERB-Conv--NOUN-Acc (4)
- VERB-Fin--NOUN-Acc (832)
- VERB-Fin--NOUN-Gen (4)
- VERB-Fin--NOUN-Nom (11)
- VERB-Fin--PRON (5)
- VERB-Fin--PRON-Acc (297)
- VERB-Fin--PRON-Acc-ADP(na) (8)
- VERB-Fin--PRON-Acc-ADP(o) (1)
- VERB-Fin--PRON-Nom (3)
- VERB-Inf--NOUN-Acc (424)
- VERB-Inf--NOUN-Gen (2)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--PRON (7)
- VERB-Inf--PRON-Acc (115)
- VERB-Inf--PRON-Acc-ADP(na) (2)
- VERB-Inf--PRON-Acc-ADP(za) (1)
- VERB-Part--NOUN-Acc (2045)
- VERB-Part--NOUN-Gen (11)
- VERB-Part--NOUN-Nom (18)
- VERB-Part--PRON (14)
- VERB-Part--PRON-Acc (727)
- VERB-Part--PRON-Acc-ADP(na) (22)
- VERB-Part--PRON-Acc-ADP(pre) (1)
- VERB-Part--PRON-Nom (2)
- iobj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--PRON (4)
- VERB-Fin--PRON-Acc (5)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--PRON (4)
- VERB-Inf--PRON-Acc (5)
- VERB-Part--NOUN-Acc (4)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON (32)
- VERB-Part--PRON-Acc (22)
- VERB-Part--PRON-Acc-ADP(na) (1)
Reflexive Verbs
- This corpus contains 710 lemmas that occur at least once with an expl:pv child. Examples: stať sa, spýtať sa, vrátiť sa, usmiať sa, volať sa, zjaviť sa, snažiť sa, zasmiať sa, báť sa, pomyslieť si, páčiť sa, sadnúť si, všimnúť si, zdať sa, dostať sa, rozhodnúť sa, narodiť sa, objaviť sa, dozvedieť sa, myslieť si, otočiť sa, spomenúť si, stretnúť sa, venovať sa, zmocniť sa, nachádzať sa, pokúšať sa, uvedomiť si, podariť sa, pýtať sa, dať sa, obrátiť sa, tváriť sa, ocitnúť sa, vypytovať sa, dívať sa, ozvať sa, skončiť sa, smiať sa, zaoberať sa, diať sa, správať sa, stávať sa, vzdať sa, začať sa, želať si, dotknúť sa, konať sa, odvážiť sa, ozývať sa
Reflexive Passive
- This corpus contains 158 lemmas that occur at least once with an expl:pass child. Examples: dať sa, predpokladať sa, hovoriť sa, nájsť sa, podávať sa, pozrieť sa, spomínať sa, vravieť sa, vysvetľovať sa, ísť sa, mať sa, používať sa, robiť sa, udeľovať sa, vytvoriť sa, chcieť sa, financovať sa, môcť sa, otvárať sa, pokladať sa, považovať sa, povrávať sa, pracovať sa, presúvať sa, písať sa, spájať sa, ukázať sa, vyrobiť sa, vyrábať sa, vziať si, zapichnúť sa, zastaviť sa, zmeniť sa, aplikovať sa, byť sa, dediť sa, doniesť sa, dopiecť sa, dozvedieť sa, držať sa, dýchať sa, hlasovať sa, hovorievať sa, meniť sa, merať sa, miešať sa, mlieť sa, myslieť si, máčať sa, nachádzať sa
Verbs with Reflexive Core Objects
- This corpus contains 57 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: povedať si, prečítať si, hľadieť si, napraviť si, nájsť si, obliekať sa, odkryť si, pošúchať si, upraviť si, veriť si, bičovať sa, brúsiť si, chytiť si, farbiť sa, hladkať si, hovoriť si, kefovať si, korunovať sa, nastaviť si, obdivovať sa, objať si, objednávať si, obliecť si, obliekať si, obnažovať seba, obuť si, oprašovať si, ovplyvňovať sa, pomädliť si, povzbudzovať sa, poškrabať sa, presvedčiť seba, prikázať si, prinútiť sa, pripadať si, prisahať si, priznať si, strhnúť si, ubrániť sa, udrieť si, umývať sa, uvidieť sa, vravieť si, vydrhnúť si, vyhlasovať seba, vymaniť si, vynadať si, vytiahnuť si, vyzliecť sa, vyzliecť si
- Out of those, 1 lemmas occurred more than once, but never without a reflexive dependent. Examples: pošúchať
Relations Overview
- This corpus uses 10 relation subtypes: acl:relcl, advmod:emph, aux:pass, csubj:pass, det:numgov, expl:pass, expl:pv, flat:foreign, nsubj:pass, obl:arg
- The following 1 main types are not used alone, they are always subtyped: expl
- The following 5 relation types are not used in this corpus at all: dislocated, clf, list, goeswith, reparandum