UD Romanian Nonstandard
Language: Romanian (code: ro
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.1 release.
The following people have contributed to making this treebank part of UD: Cătălina Mărănduc, Cenel-Augusto Perez, Victoria Bobicev, Cătălin Mititelu, Florinel Hociung, Valentin Roșca, Roman Untilov, Petru Rebeja.
Repository: UD_Romanian-Nonstandard
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: bible, poetry
Questions, comments? General annotation questions (either Romanian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [catalinamaranduc (æt) gmail • com, perez_cenel_augusto (æt) yahoo • com, victoria • bobicev (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Romanian Non-standard UD treebank (called UAIC-RoDia) is based on UAIC-RoDia Treebank. UAIC-RoDia = ISLRN 156-635-615-024-0
The Romanian Non-standard UD treebank (called UAIC-RoDia)is based on UAIC-RoDia Treebank (The Treebank of the Faculty of Computer Science, ”AL. I. Cuza” University, Iași, Romania). This is a balanced treebank. The Contemporary standard part of it (Perez, 2014) was included in the UD-Romanian-RRT Treebank. Since 2015, the UAIC Treebank has been developed by including several nonstandard language genres, Old Romanian, Chat, Folklore (Mărănduc 2015, 2016, 2017c, 2018, Perez 2016), considering that the nonstandard langage is more used than the standard one. The digitization of cultural heritage includes the old texts and also the folklore, wich is an oral phenomenon that is threatened with extinction (Mărănduc, 2017b).
The UAIC-RoDia Treebank (ISLRN 156-635-615-024-0) has in March 2020, 34,794 sentences in its basic format.
For the first release, we transposed in the UD format a part of the New Testament from Alba Iulia (1648), 916 sentences. It is the first printed New Testament in Romanian, with Cyrillic letters. The text with Latin alphabet is obtained by an OCR program built at the Institut of Mathematics and Computer Science of Chișinău, Republic of Moldova, by a group of researchers led by Alexander Colesnicov and Ludmila Malahov (Colesnicov 2016, Cojocaru 2017).
The first release includes in the second part, 284 senteces are folklore in verses; 230 sentences from Romania and 54 from the Republic of Moldova (where the Romanian language is spoken)(Bobicev 2016).
For the second release, we finished the transposition in UD format of the first part of the New Testament (1648): all the prefaces and the four Gospels = 5,172 sentences, including the 916 fron the first release.
For the third release, all the Alba Iulia New Testament (1648).
For the next release, Flower of Gifts, Moldavian Ballads, Romanian Ballads.
Also, the contribution of the Republic of Moldova is now 1805 sentences folklore.
Today, 23 September 2019, we add a new sub-corpus, Caragea’s Law, 1818. In May 2020 we add the whole book Dosoftei, ”David’s Psalms translation with rhymes” (1673), and the first part of the Ion Neculce’s ”Chronicle” (1743), to be continued. In October 2020 we added 1000 sentences ”Romanian Ballads”. The folclore is at the beginning of the train document, but 50 sentences are at the end of the test and dev documents. Also in October 2020 we addad the rest of the Ion Neculce’s ”Chronicle” (1743).
Acknowledgments
Statistics of UD Romanian Nonstandard
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
AdpType – Case – Compound – Definite – Degree – Gender – Mood – Number – Number[psor] – NumForm – NumType – PartType – Person – Polarity – Polite – Position – Poss – PronType – Reflex – Strength – Tense – Typo – Variant – VerbForm
Relations
acl – advcl – advcl:tcl – advmod – advmod:tmod – amod – appos – aux – aux:pass – case – cc – cc:preconj – ccomp – ccomp:pmod – clf – compound – conj – cop – csubj – csubj:pass – dep – det – discourse – expl – expl:impers – expl:pass – expl:poss – expl:pv – fixed – flat – goeswith – iobj – list – mark – nmod – nmod:tmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – obl:pmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 26225 sentences and 572436 tokens.
- This corpus contains 115050 tokens (20%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 1320 types of words that contain both letters and punctuation. Examples: -i, s-, -l, -au, n-, -n, i-, l-, -mi, într-, mi-, ș-, m-, -s, de-, ce-, le-, -ț, -să, -o, c-, -m, ş-, -a, și-, te-, ne-, -și, -său, pentr-, -ți, Mihai-, -va, -te, Dumitraşco-, -mă, -am, să-, -le, -vă, -ș, dintr-, şi-, -ar, -ai, Grigorie-, păn', -or, d-, nu-
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 15 word types tagged as particles (PART): -a, -să, a, a-, ca, n-, s, s-, sa, se, si, sâ, sî, să, să-
- This corpus contains 146 lemmas tagged as pronouns (PRON): ,, -ul, -unul, Iș, Puținei, ac, acel, acela, același, acest, acesta, aceștia, aicela, alt, alta, altceva, altcineva, altuie, altul, alții, alțâi, atât, atâta, atâtea, ca, care, careaș, careș, ce, cei, ceilalți, cel, celi, celălalt, cestălalt, ceva, cevaș, cevași, ci, cine, cineva, cineş, cineș, cineși, cutare, cât, câtva, destul, dumnealor, dumnealui, dumneata, dumneavoastră, dânsa, dânsul, e1, ea, el, eluși, eu, fi, fiecare, fiece, fiecine, fieșcare, fieșcine, fiește, fieștecare, fieștecine, io, l, lui, lume, mata, meu, mine, mineși, mult, mă, măria, mărie, nemica, nemică, neșcine, neșcât, neștine, niciunul, niemic, nime, nimeni, nimic, nimicuța, nimică, noiși, nostru, nou, oare, oarecare, oarece, oarecine, oarecât, oricare, orice, oricine, oricât, orișicine, puțin, puținel, puțintel, se, sfinția, sfinție, sfânt, sieși, sine, sineși, singur, sinw, ssine, să, său, te, tot, totul, tu, tău, un, unul, voi, voiși, vostru, vrea, vreun, vreunul, îl, împărăție, însul, însumi, însuși, însuți, îş, îș, ăla, ălalalt, ăsta, și, șie
- This corpus contains 104 lemmas tagged as determiners (DET): -sâu, -său, -ul, Fieștece, a, ac, aceeşi, acel, acela, același, aceloralalți, acest, acesta, acestaș, acestași, acestu, aceșta, aceștie, acătare, al, alde, alt, altul, atât, atâta, atâte, avea, care, ce, cee, cei, ceilalți, cel, celi, celălalt, ceva, ci, cutare, cât, câte, câtva, cîti, cîtva, cîțva, destul, el, eu, fiecare, fieșcare, fiește, fieștecare, ista, iui, lu, lui, meu, mult, nescai, nescaiva, nescare, nescareva, neșcât, niciun, niscai, niscaiva, niscareva, niscarva, niscavai, niște, nostru, o, oare, oarecare, oarece, oarecine, oarecât, ori, oricare, orice, oricât, plin, puţîn, puțin, puținel, puțintel, sa, său, tot, tău, un, unul, vostru, vrea, vreo, vreun, vreunul, însumi, însuși, însuți, Ăle, ăla, ălalalt, ălălalt, ăsta
- Out of the above, 61 lemmas occurred sometimes as PRON and sometimes as DET: -ul, ac, acel, acela, același, acest, acesta, alt, altul, atât, atâta, care, ce, cei, ceilalți, cel, celi, celălalt, ceva, ci, cutare, cât, câtva, destul, el, eu, fiecare, fieșcare, fiește, fieștecare, lui, meu, mult, neșcât, nostru, oare, oarecare, oarece, oarecine, oarecât, oricare, orice, oricât, puțin, puținel, puțintel, său, tot, tău, un, unul, vostru, vrea, vreun, vreunul, însumi, însuși, însuți, ăla, ălalalt, ăsta
- This corpus contains 6 lemmas tagged as auxiliaries (AUX): avea, fi, putea, trebui, vrea, ști
- Out of the above, 6 lemmas occurred sometimes as AUX and sometimes as VERB: avea, fi, putea, trebui, vrea, ști
- There are 4 (de)verbal forms:
- Fin
- AUX: era, vor, e, iaste, -i, ai, fie, poate, -s, au
- VERB: zise, era, facă, dea, are, avea, ia, face, zice, făcea
- Ger
- AUX: fiind, fiindu, nefiind, neputînd, fîindu, neputîndu, neputând, Nefiindu, hiind, nefind
- VERB: zicînd, avînd, răspunzînd, văzînd, auzind, grăind, fiind, eșind, vădzînd, luînd
- Inf
- AUX: fi, hi, putea, hii, ști, fii, trebui, fi-, fir-, fire
- VERB: da, face, veni, fi, lua, vedea, zice, arăta, pune, vrea
- Part
- AUX: fost, putut, fostu, vrut, pututu
- VERB: făcut, dat, luat, pus, scris, dus, venit, lăsat, vinit, început
Nominal Features
- Fem
- ADJ: bună, svînta, svîntă, bune, frumoasă, mare, sfîntă, grea, curată, plină
- DET: a, o, toată, ta, toate, tot, cea, mea, multe, sa
- NOUN: țara, țară, oaste, lume, pace, parte, casa, credință, vreme, casă
- NUM: doao, treia, mii, două, doa, mie, sute, doo, sută, patra
- PRON: o, aceaia, le, aceasta, carea, toate, aceastea, -o, ei, ea
- PROPN: Poartă, Moldova, Muntenească, Evangheliia, Tighine, Cameniță, Leșască, Ungurească, Leşască, Maria
- VERB: scrisă, dată, scrise, făcută, făcute, adevărată, pusă, adevărate, aleasă, ascunsă
- VERB-Part: scrisă, dată, scrise, făcută, făcute, adevărată, pusă, adevărate, aleasă, ascunsă
- Masc
- ADJ: bun, svinte, sfînt, datoriu, mic, rău, omenesc, verde, viu, nou
- ADV: cît
- AUX-Part: fost, vrut
- DET: un, al, cel, mieu, tău, cei, său, acel, toți, nostru
- NOUN: vodă, domnul, doamne, omul, om, domnului, cuvîntul, oameni, împăratul, turcii
- NUM: doi, întîiu, amîndoi, doisprăzeace, întîi, întăiu, dintîiu, un, doilea, dentîiu
- PRON: lui, el, -l, -i, carele, ei, l-, carii, i-, toți
- PROPN: dumnezău, Hristos, Iisus, Pavel, David, Pătru, Ioan, Mihai-, Duca, Dumitraşco-
- VERB-Part: scris, făcut, dat, pus, născut, dus, zis, ales, iubit, legat
- Plur
- ADJ: mari, bune, buni, mici, nalte, reale, grele, minciunoși, scumpe, tari
- AUX: au, am, vor, sînt, -s, veți, ați, or, ar, vom
- AUX-Fin: vor, -s, au, fiți, pot, am, fireți, fură, putum, putură
- DET: toate, multe, cei, toți, mulți, tale, alte, ale, voastre, sale
- NOUN: oameni, turcii, bani, oamenii, ani, boierii, moscalii, ucenicii, boieri, turci
- NUM: trei, doi, cinci, doao, patru, mii, două, nouă, trii, șapte
- PRON: lor, le, -i, ei, voi, carii, noi, vă, ne, voao
- PROPN: Ieşi, Iași, Iaşi, Ieș, București, Iașii, Gălați, Focșani, Galați, Bucureștii
- VERB: au, zisără, fac, zic, știți, veniră, arată, faceți, știm, am
- VERB-Fin: au, zisără, fac, zic, știți, veniră, arată, faceți, știm, am
- VERB-Part: scrise, făcute, aleși, chemați, fericiți, sămnați, adevărate, puse, coapte, date
- Sing
- ADJ: mare, bună, bun, svînta, svinte, verde, sfînt, datoriu, mic, svîntă
- ADV: cît
- AUX: va, -i, -au, era, a, iaste, e, ai, este, voiu
- AUX-Fin: era, e, iaste, -i, ai, poate, fu, putea, are, poci
- AUX-Part: fost, vrut
- DET: lui, a, un, o, toată, ta, tot, al, cel, cea
- NOUN: vodă, domnul, doamne, țara, țară, omul, om, domnului, oaste, cuvîntul
- NUM: întîiu, treia, doa, mie, sută, patra, întăiu, dintîiu, un, doao
- PRON: lui, el, -l, -i, carele, l-, o, mă, eu, -mi
- PROPN: dumnezău, Iisus, Hristos, Pavel, David, Poartă, Pătru, Ioan, Mihai-, Duca
- VERB: zise, era, are, avea, face, făcea, zicea, da, dă, zice
- VERB-Fin: zise, era, are, avea, face, făcea, zicea, da, dă, zice
- VERB-Part: scris, făcut, scrisă, dată, dat, pus, născut, dus, zis, ales
- Acc
- ADP: de, cu, la, în, pre, din, pe, ca, pentru, după
- PRON: să, -l, s-, el, -i, mă, l-, o, se, s
- Acc,Nom
- ADJ: mare, bună, bun, svînta, verde, sfînt, datoriu, mic, svîntă, bune
- ADV: cît
- DET: a, un, o, toată, ta, toate, tot, al, cel, cea
- NOUN: vodă, domnul, țara, țară, omul, om, oaste, cuvîntul, lume, oameni
- NUM: doao, mii, mie, amîndoi, doo, sută, sute, giumătate, amândoi, jumătate
- PRON: ce, el, carele, cine, carii, aceaia, tu, care, aceasta, carea
- PROPN: dumnezău, Iisus, Hristos, Pavel, David, Poartă, Pătru, Ioan, Mihai-, Duca
- VERB: scrisă, dată, făcută, adevărată, pusă, aleasă, -ndurată, ascunsă, neapărată, vestită
- VERB-Part: scrisă, dată, făcută, adevărată, pusă, aleasă, -ndurată, ascunsă, neapărată, vestită
- Dat
- ADP: asupră, derept, nainte, asemenea, denainte, înainte
- PRON: -i, lor, -mi, le, mi-, lui, i-, voao, mi, -ț
- Dat,Gen
- ADJ: svintei, svîntului, mari, vechi, creștinești, leșești, marelui, moschiceşti, sfinte, sfinților
- DET: lui, celui, celor, sale, tuturor, unui, aceștii, tale, lu, acelui
- NOUN: domnului, oamenilor, omului, jidovilor, împăratului, turcilor, pămîntului, trupului, popilor, lumii
- NUM: mii, sute, amîndurora, tustrei, unii, amânduror, tusșapte, unui, zeacelui, șeaselui
- PRON: lor, căruia, celora, cărora, tuturor, celor, cui, altuia, celuia, acelora
- PROPN: Ducăi, Moscului, Moldovii, Moldovei, Evangheliei, Brîncovanului, Neamțului, Evanghelii, Hotinului, Galileei
- VERB-Part: adevărate, arate, curate, -nnodate, aduse, arătate, uscate, încleștate, acoperite, alease
- Gen
- ADP: înaintea, asupra, împrotiva, împotriva, asupră, denaintea, dinaintea, înainte, desupra, denainte
- PRON: lui, ei, măriei, lor, măriii, o, mării, iei, svințiii, -i
- Nom
- PRON: eu, ei, noi, dînșii, dînşii, dânșii, înșii, ele, iei, le
- Voc
- ADJ: svinte, sfinte, mișele, Mititelule, cinstite, dragă, luminate, sărmane, înălţate, Puternice
- NOUN: doamne, fraților, Învățătoriule, părinte, frate, bade, stăpîne, bădiță, cuvinte, dorule
- PROPN: Doamne, Gruio, Iisuse, Dumitre, Saule, Staline, Manole, Agrippo, Dumnezeule, Ioane
- Def
- ADJ: svînta, svîntul, svintei, svintele, mișelul, svîntului, bietul, cinstitul, sfîntul, bune
- DET: lui, -lea, -a, lu, un, -le, iui, niște, -lui
- NOUN: domnul, țara, omul, domnului, cuvîntul, împăratul, turcii, oamenii, numele, fiiul
- NUM: doilea, treile, doa, treilea, doile, triile, întîia, întîiul, patrulea, un
- PRON: carele, carii, carea, unii, totul, alții, toții, unul, toțîi, alțîi
- PROPN: Duca, Moldova, Evangheliia, Brîncovanul, Tighine, Lupul, Dumitraşco-, Ducăi, Gruia, Moscului
- Ind
- ADJ: mare, bună, bun, mari, svinte, verde, sfînt, datoriu, mic, svîntă
- NOUN: vodă, doamne, țară, om, oaste, lume, oameni, pace, parte, bani
- NUM: mii, doao, mie, sute, doo, sută, un, giumătate, întîi, întăi
- PROPN: dumnezău, Hristos, Iisus, Pavel, David, Poartă, Pătru, Ioan, Mihai-, Costantin
Degree and Polarity
- Pos
- ADJ: mare, bună, vel, bun, mari, svinte, vel-, svînta, verde, sfînt
- NOUN: SVÎNT, orb, plata, venitori, vergurele, Îndrăcitul
- Neg
- ADV: nu, n-, nici, nice, nece, nu-, n, niceodată, niciodată, neceodată
- AUX: nefiind, fii, neputînd, neputîndu, fi, neputând, Nefiindu, hii, nefind, neputîndu-
- AUX-Ger: nefiind, neputînd, neputîndu, neputând, Nefiindu, nefind, neputîndu-
- CCONJ: nici, nece, nice, neci, ce, ci, Nice-, Nîci
- VERB-Fin: lăsa, face, pleca, da, lua, uita, duce, speria, teame, curvi
- VERB-Ger: neavînd, neștiind, neștiindu, nefiind, nefăcînd, neavându, neplinind, neaflîndu-, neavând, necrezînd
- VERB-Part: neapărată, Neajunse, nescris, neîncetat, neclătită, nemîncat, nencetată, nescrisă, nespălate, nevătămat
- Pos
- ADP: ca
- AUX: fiind, fiindu, fii, fîindu, fost, hiind, putîndu, vrut
- AUX-Ger: fiind, fiindu, fîindu, hiind, putîndu
- AUX-Part: fost, vrut
- CCONJ: și, şi, iară, ce, iar, sau, dar, ș-, au, ş-
- PRON: ce
- SCONJ: că, de, c-, să, de-, dacă, deaca, căce, căci, di
- VERB: zicînd, avînd, scris, răspunzînd, văzînd, auzind, făcut, grăind, scrisă, dă
- VERB-Fin: dă, scoală, ia, scoate, vino, lasă, pasă, spune, fă, du
- VERB-Ger: zicînd, avînd, răspunzînd, văzînd, auzind, grăind, fiind, eșind, vădzînd, luînd
- VERB-Part: scris, făcut, scrisă, dată, dat, pus, născut, scrise, dus, zis
- Long
- AUX: fireți, fire, fire-, hire
- AUX-Fin: fireți
- AUX-Inf: fire, fire-, hire
- VERB-Fin: teamereți, grijireți, giudecareți, dareți, oprireți, spămîntareți, contenireți, creadereți, giurareți, greșireți
- VERB-Inf: dare, hirea, Vreare, grăiare, aninare, duceare, luvare, lăcuirea, priimi, Pohtire
Verbal Features
- Imp
- AUX: fiți, fii, fireți, fi, fiţi, hii, sinteți, sunteți
- AUX-Fin: fireți, fiți
- VERB-Fin: dă, scoală, ia, scoate, vino, lasă, pasă, spune, fă, faceți
- Ind
- AUX: au, va, -i, -au, era, am, a, iaste, vor, e
- AUX-Fin: era, vor, e, iaste, -i, ai, poate, -s, au, fu
- VERB: zise, era, are, avea, făcea, face, zicea, da, zic, zice
- VERB-Fin: zise, era, are, avea, făcea, face, zicea, da, zic, zice
- VERB-Part: va
- Sub
- AUX: fie, fii, fiu, poată, fiți, hie, fim, fie-, pot, putem
- AUX-Fin: fie, fiți, poată
- VERB-Fin: facă, dea, ia, margă, vie, aibă, vază, fie, ducă, stea
- Imp
- AUX: era, putea, eram, iera, vrea, avea, erați, erau, erea, pute
- AUX-Fin: era, putea
- VERB-Fin: era, avea, făcea, zicea, da, lua, mergea, sta, vedea, vrea
- Past
- AUX: fu, fură, fuiu, putu, putură, fum, putum, fuset, fuseși, sînt
- AUX-Fin: fu, fură, putum, putură, putuși
- VERB-Fin: zise, dzise, zisără, veni, fu, răspunse, făcu, veniră, văzu, deade
- Pqp
- AUX: fusese, fusesă, putusă, fuses-, fusesie, fusăsă, era, fusesem
- VERB-Fin: făcusă, luasă, zisease, venise, apucasă, dedesă, rămăsesă, vinisă, începusă, agiunsesă
- Pres
- AUX: au, va, -i, -au, am, a, iaste, vor, e, sînt
- AUX-Fin: vor, e, iaste, -i, ai, fie, poate, -s, au, pot
- VERB: facă, dea, are, zice, face, fac, ia, zic, poate, vine
- VERB-Fin: facă, dea, are, zice, face, fac, ia, zic, poate, vine
- VERB-Part: va
Pronouns, Determiners, Quantifiers
- Art
- DET: lui, a, al, ale, -a, ai, -lea, lu, -al, un
- Dem
- DET: cel, cea, cei, acel, acea, această, acest, aceasta, ceale, acesta
- PRON: aceaia, aceasta, cela, aceastea, acesta, ceia, cei, acela, cel, aceia
- Emp
- DET: însuși, înșivă, însuți, înșiși, înșine, însumi, însuşi, însuș, Înșiș, înseși
- PRON: însuși, eiși, voiși, înșivă, mineși, sineși, loruși, însuți, eluși, noiși
- Ind
- ADV: tot, cumva, atîta, mult, uneori, oarecum, oarecînd, Puţinel, cîndva, multu
- DET: un, o, toată, toate, tot, multe, toți, multă, mulți, alte
- PRON: toate, toți, unul, unii, alții, altul, mulți, una, cineva, tot
- Int,Rel
- ADV: cum, cînd, unde, când, cît, precum, cumu, cîte, cât, cîndu
- DET: ce, care, cîte, câte, cîtă, cîți, câtă, cît, cîțva, carii
- PRON: ce, carele, cine, carii, care, carea, ce-, căruia, cărora, cui
- Neg
- DET: nicio, niciun, necio, neșchite, neșchită
- PRON: nime, nemică, nemic, nimic, nimeni, nimenea, nimică, nemurui, nimica, nemărui
- Prs
- DET: ta, mieu, mea, tău, său, sa, nostru, -său, tale, sale
- PRON: să, lui, el, -i, -l, s-, lor, ei, le, mă
- Tot
- NUM: amîndoi, amândoi, amîndoao, îmbe, amîndurora, tustrei, amîndouă, tuspatru, tusșapte, înbe
- Card
- NUM: trei, doi, doao, cinci, patru, mii, două, nouă, sute, mie
- Frac
- NUM: giumătate, jumătate, Jumate, amîndoă, fercu-, giumătati, șverturi
- Mult
- NUM: îndoit, tustrii, înbe, Cîtetrele, cîtenouă, tretii, tustreli, îndoită, îndzăcit
- Ord
- NUM: întîiu, treia, doa, întăiu, dentîiu, întîi, patra, dintîiu, doua, dintîi
- Yes
- DET: a, al, ale, ai, -a, tău, mieu, -al, ta, vostru
- PRON: ta, meu, nostru, tău
- Yes
- PRON: să, se, s-, -să, -și, sine, -se, și, și-, -s
- 1
- AUX: am, voiu, oi, -am, voi, vom, sînt, aș, -oi, sîntem
- AUX-Fin: am, pociu, Oi, poci, pot, putum, s, sunt, sînt, voiu
- DET: mieu, mea, nostru, voastră, noastră, meale, miei, noastre, meu, noștri
- PRON: mă, eu, -mi, mine, noi, tu, mi-, m-, ne, mi
- VERB: am, știu, fac, zic, duc, știm, rog, avem, dau, văzuiu
- VERB-Fin: am, știu, fac, zic, duc, știm, rog, avem, dau, văzuiu
- 2
- AUX: ai, ești, veți, ați, vei, -ai, sînteți, -i, fii, fiți
- AUX-Fin: ai, fiți, ești, fireți, poți, putuși, veți
- DET: ta, tău, tale, voastre, vostru, tăi, voștri, -ta, tăle, -tău
- PRON: te, voi, vă, voao, tine, -ț, te-, ț, ție, -te
- VERB-Fin: faci, știți, dai, dă, faceți, ai, scoală, știi, ia, vezi
- 3
- ADV: cît
- AUX: au, va, -au, -i, era, a, iaste, vor, e, fie
- AUX-Fin: era, vor, e, iaste, -i, fie, poate, -s, au, fu
- DET: toată, toate, tot, ce, multe, său, acel, sa, toți, multă
- PRON: să, ce, lui, el, -i, -l, s-, lor, ei, carele
- VERB: zise, era, facă, dea, are, avea, zice, făcea, face, zicea
- VERB-Fin: zise, era, facă, dea, are, avea, zice, făcea, face, zicea
- VERB-Part: va
- Form
- PRON: însul, svinția, măriei, înșii, Măriia, dumitale, dumneavoastră, mării, svințiile, -ți
- Plur
- DET: nostru, voastră, noastră, voastre, vostru, noastre, noștri, voștri, miei, noștrii
- PRON: nostru, noastră, noastre, voastră, noștri, voastre, vostru, ca, noştri
- Sing
- DET: ta, mieu, mea, tău, său, sa, -său, tale, sale, meale
- PRON: ta, mea, meu, tău, sa, săi, meale, sale, tăi, mieu
Other Features
- AdpType
- Prep
- ADP: de, cu, la, în, pre, din, pe, ca, pentru, după
- Prep
- Compound
- Yes
- ADP: din, pentru, după, den, prin, preste, pren, pentr-, despre, pînă
- ADV: nece
- CCONJ: deci, nece, nice, dece, nici, Decii, ce, neci, deacii, dară
- SCONJ: deaca, dacă, căce, căci, deca, dac-, ca, pentru, daca, deși
- Yes
- NumForm
- Digit
- NUM: 2, 3, 4, 7, 12, 5, 1, 6, 10, 8
- Roman
- NUM: 16, întîiu, I, XIV, XX, XXI, XXII, XXIII, XXIV, XXV
- Word
- NUM: trei, doi, doao, cinci, patru, întîiu, treia, mii, două, doa
- Digit
- PartType
- Inf
- PART: a, -a, a-, n-, s-
- Sub
- PART: să, s-, să-, se, sâ, -să, a, ca, s, -a
- Inf
- Position
- Postnom
- DET: acesta, acela, aceștiia, cela, aceasta, aceia, acestuia, aceaia, acealea, ceia
- Prenom
- DET: acel, această, acest, acea, acei, aceste, acestu, ceastă, acele, acelui
- Postnom
- Strength
- Strong
- PRON: el, lor, mine, voi, ei, lui, voao, tine, noi, mie
- Weak
- PRON: să, -i, -l, s-, le, mă, i-, l-, o, se
- Strong
- Typo
- Yes
- ADP: pînă
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: fi.
- This corpus uses 6 lemmas as auxiliaries (aux). Examples: avea, vrea, putea, fi, ști, trebui.
- This corpus uses 2 lemmas as passive auxiliaries (aux:pass). Examples: fi, avea.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--PRON-Acc,Nom (1)
- VERB--PRON-Nom (1)
- VERB-Fin--NOUN-Acc,Nom (7966)
- VERB-Fin--NOUN-Acc,Nom-ADP(ca) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(ca)-ADP(la) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(cu) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(către) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(de) (5)
- VERB-Fin--NOUN-Acc,Nom-ADP(din) (6)
- VERB-Fin--NOUN-Acc,Nom-ADP(dintre) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(drept) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(fără) (2)
- VERB-Fin--NOUN-Acc,Nom-ADP(la) (3)
- VERB-Fin--NOUN-Acc,Nom-ADP(moșie) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(pe) (3)
- VERB-Fin--NOUN-Acc,Nom-ADP(pentru) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(în) (3)
- VERB-Fin--NOUN-Acc,Nom-ADP(întru) (2)
- VERB-Fin--NOUN-Dat,Gen (27)
- VERB-Fin--NOUN-Voc (3)
- VERB-Fin--PRON (38)
- VERB-Fin--PRON-Acc (33)
- VERB-Fin--PRON-Acc,Nom (5592)
- VERB-Fin--PRON-Acc,Nom-ADP(ca) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(cu) (4)
- VERB-Fin--PRON-Acc,Nom-ADP(de) (12)
- VERB-Fin--PRON-Acc,Nom-ADP(din) (2)
- VERB-Fin--PRON-Acc,Nom-ADP(pe) (4)
- VERB-Fin--PRON-Dat (19)
- VERB-Fin--PRON-Dat,Gen (13)
- VERB-Fin--PRON-Gen (14)
- VERB-Fin--PRON-Nom (835)
- VERB-Ger--NOUN-Acc,Nom (556)
- VERB-Ger--NOUN-Dat,Gen (2)
- VERB-Ger--NOUN-Voc (1)
- VERB-Ger--PRON (3)
- VERB-Ger--PRON-Acc (1)
- VERB-Ger--PRON-Acc,Nom (191)
- VERB-Ger--PRON-Gen (1)
- VERB-Ger--PRON-Nom (68)
- VERB-Inf--NOUN-Acc,Nom (1485)
- VERB-Inf--NOUN-Acc,Nom-ADP(cu) (2)
- VERB-Inf--NOUN-Acc,Nom-ADP(de) (1)
- VERB-Inf--NOUN-Acc,Nom-ADP(din) (1)
- VERB-Inf--NOUN-Acc,Nom-ADP(la) (2)
- VERB-Inf--NOUN-Acc,Nom-ADP(împotriva) (1)
- VERB-Inf--NOUN-Acc,Nom-ADP(întru) (1)
- VERB-Inf--NOUN-Dat,Gen (6)
- VERB-Inf--PRON (10)
- VERB-Inf--PRON-Acc (11)
- VERB-Inf--PRON-Acc,Nom (998)
- VERB-Inf--PRON-Acc,Nom-ADP(cu) (1)
- VERB-Inf--PRON-Acc,Nom-ADP(pe) (2)
- VERB-Inf--PRON-Dat (14)
- VERB-Inf--PRON-Dat,Gen (2)
- VERB-Inf--PRON-Gen (7)
- VERB-Inf--PRON-Nom (236)
- VERB-Part--NOUN-Acc,Nom (2916)
- VERB-Part--NOUN-Acc,Nom-ADP(ca) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(de) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(din) (2)
- VERB-Part--NOUN-Acc,Nom-ADP(în) (1)
- VERB-Part--NOUN-Dat,Gen (14)
- VERB-Part--NOUN-Voc (2)
- VERB-Part--PRON (3)
- VERB-Part--PRON-Acc (9)
- VERB-Part--PRON-Acc,Nom (1344)
- VERB-Part--PRON-Acc,Nom-ADP(cu) (1)
- VERB-Part--PRON-Dat (11)
- VERB-Part--PRON-Dat,Gen (6)
- VERB-Part--PRON-Gen (3)
- VERB-Part--PRON-Nom (269)
- obj
- VERB-Fin--NOUN-Acc,Nom (9050)
- VERB-Fin--NOUN-Acc,Nom-ADP(cu) (5)
- VERB-Fin--NOUN-Acc,Nom-ADP(de) (9)
- VERB-Fin--NOUN-Acc,Nom-ADP(de)-ADP(a) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(după) (3)
- VERB-Fin--NOUN-Acc,Nom-ADP(fără) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(la) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(pe) (3)
- VERB-Fin--NOUN-Acc,Nom-ADP(în) (1)
- VERB-Fin--NOUN-Dat,Gen (26)
- VERB-Fin--NOUN-Dat,Gen-ADP(în) (1)
- VERB-Fin--NOUN-Dat,Gen-ADP(înaintea) (1)
- VERB-Fin--NOUN-Voc (5)
- VERB-Fin--PRON (3)
- VERB-Fin--PRON-Acc (5053)
- VERB-Fin--PRON-Acc,Nom (1601)
- VERB-Fin--PRON-Acc,Nom-ADP(ca)-ADP(pe) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(de) (3)
- VERB-Fin--PRON-Acc,Nom-ADP(din) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(fără) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(la) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(pe) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(pentru) (1)
- VERB-Fin--PRON-Acc-ADP(de) (1)
- VERB-Fin--PRON-Acc-ADP(după) (1)
- VERB-Fin--PRON-Acc-ADP(pe) (5)
- VERB-Fin--PRON-Dat (177)
- VERB-Fin--PRON-Dat,Gen (9)
- VERB-Fin--PRON-Gen (8)
- VERB-Fin--PRON-Nom (16)
- VERB-Ger--NOUN-Acc,Nom (1073)
- VERB-Ger--NOUN-Acc,Nom-ADP(drept) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(pe) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(spre) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(în) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(întru) (1)
- VERB-Ger--NOUN-Dat,Gen (6)
- VERB-Ger--NOUN-Voc (2)
- VERB-Ger--PRON-Acc (319)
- VERB-Ger--PRON-Acc,Nom (147)
- VERB-Ger--PRON-Acc,Nom-ADP(de) (1)
- VERB-Ger--PRON-Acc,Nom-ADP(din) (1)
- VERB-Ger--PRON-Dat (15)
- VERB-Ger--PRON-Dat,Gen (1)
- VERB-Inf--NOUN-Acc,Nom (1707)
- VERB-Inf--NOUN-Acc,Nom-ADP(cu) (1)
- VERB-Inf--NOUN-Acc,Nom-ADP(de) (1)
- VERB-Inf--NOUN-Dat,Gen (11)
- VERB-Inf--PRON (3)
- VERB-Inf--PRON-Acc (1061)
- VERB-Inf--PRON-Acc,Nom (374)
- VERB-Inf--PRON-Acc,Nom-ADP(cu) (1)
- VERB-Inf--PRON-Acc,Nom-ADP(de) (1)
- VERB-Inf--PRON-Acc,Nom-ADP(pe) (1)
- VERB-Inf--PRON-Acc-ADP(pe) (1)
- VERB-Inf--PRON-Dat (46)
- VERB-Inf--PRON-Dat,Gen (3)
- VERB-Inf--PRON-Gen (3)
- VERB-Inf--PRON-Nom (5)
- VERB-Part--NOUN-Acc,Nom (2785)
- VERB-Part--NOUN-Acc,Nom-ADP(ca) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(cu) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(cu)-ADP(de) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(de) (2)
- VERB-Part--NOUN-Acc,Nom-ADP(despre) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(până)-ADP(la) (3)
- VERB-Part--NOUN-Dat,Gen (14)
- VERB-Part--NOUN-Voc (1)
- VERB-Part--PRON (1)
- VERB-Part--PRON-Acc (2035)
- VERB-Part--PRON-Acc,Nom (644)
- VERB-Part--PRON-Acc,Nom-ADP(de) (2)
- VERB-Part--PRON-Dat (72)
- VERB-Part--PRON-Dat,Gen (7)
- VERB-Part--PRON-Nom (11)
- iobj
- VERB-Fin--NOUN-Acc,Nom (102)
- VERB-Fin--NOUN-Acc,Nom-ADP(a) (4)
- VERB-Fin--NOUN-Acc,Nom-ADP(al) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(cu) (5)
- VERB-Fin--NOUN-Acc,Nom-ADP(de) (4)
- VERB-Fin--NOUN-Acc,Nom-ADP(din) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(drept) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(la) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(pe) (2)
- VERB-Fin--NOUN-Acc,Nom-ADP(spre) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(sub) (1)
- VERB-Fin--NOUN-Acc,Nom-ADP(în) (2)
- VERB-Fin--NOUN-Dat,Gen (842)
- VERB-Fin--NOUN-Dat,Gen-ADP(asupra) (1)
- VERB-Fin--NOUN-Dat,Gen-ADP(fără) (1)
- VERB-Fin--NOUN-Voc (11)
- VERB-Fin--PRON-Acc (230)
- VERB-Fin--PRON-Acc,Nom (49)
- VERB-Fin--PRON-Acc,Nom-ADP(de) (4)
- VERB-Fin--PRON-Acc,Nom-ADP(drept) (1)
- VERB-Fin--PRON-Acc,Nom-ADP(pe) (2)
- VERB-Fin--PRON-Acc,Nom-ADP(întru) (1)
- VERB-Fin--PRON-Acc-ADP(spre) (1)
- VERB-Fin--PRON-Dat (5166)
- VERB-Fin--PRON-Dat,Gen (344)
- VERB-Fin--PRON-Gen (112)
- VERB-Fin--PRON-Nom (9)
- VERB-Ger--NOUN-Acc,Nom (7)
- VERB-Ger--NOUN-Acc,Nom-ADP(a) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(avea) (1)
- VERB-Ger--NOUN-Acc,Nom-ADP(de) (2)
- VERB-Ger--NOUN-Dat,Gen (58)
- VERB-Ger--NOUN-Voc (1)
- VERB-Ger--PRON-Acc (10)
- VERB-Ger--PRON-Acc,Nom (1)
- VERB-Ger--PRON-Acc,Nom-ADP(de) (1)
- VERB-Ger--PRON-Dat (215)
- VERB-Ger--PRON-Dat,Gen (26)
- VERB-Ger--PRON-Gen (4)
- VERB-Inf--NOUN-Acc,Nom (24)
- VERB-Inf--NOUN-Acc,Nom-ADP(de) (3)
- VERB-Inf--NOUN-Dat,Gen (142)
- VERB-Inf--PRON-Acc (45)
- VERB-Inf--PRON-Acc,Nom (11)
- VERB-Inf--PRON-Dat (821)
- VERB-Inf--PRON-Dat,Gen (85)
- VERB-Inf--PRON-Gen (12)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN-Acc,Nom (43)
- VERB-Part--NOUN-Acc,Nom-ADP(a) (1)
- VERB-Part--NOUN-Acc,Nom-ADP(de) (3)
- VERB-Part--NOUN-Dat,Gen (271)
- VERB-Part--NOUN-Dat,Gen-ADP(împotriva) (1)
- VERB-Part--NOUN-Voc (3)
- VERB-Part--PRON (1)
- VERB-Part--PRON-Acc (115)
- VERB-Part--PRON-Acc,Nom (17)
- VERB-Part--PRON-Acc,Nom-ADP(pe) (1)
- VERB-Part--PRON-Dat (1563)
- VERB-Part--PRON-Dat,Gen (87)
- VERB-Part--PRON-Gen (18)
- VERB-Part--PRON-Nom (3)
Reflexive Verbs
- This corpus contains 3285 lemmas that occur at least once with an expl:pv child. Examples: face să, arăta să, duce să, chema să, da să, întoarce să, duce s-, scula să, zice să, ruga să, cădea să, teme să, întoarce s-, apropia să, bate să, mira să, întâmpla să, închina să, umple să, face s-, vedea să, dus s, cuveni să, duce se, duce mă, afla să, pune să, bucura să, sui să, ridica să, întoarce s, duce te, lepăda să, închina s-, ține să, pomeni s-, tocmi să, vindeca să, face se, socoti să, înturna să, aduna să, apuca s-, îndrepta să, chema se, judeca să, părea să, scula s-, ruga mă, întâmpla s-
Reflexive Passive
- This corpus contains 144 lemmas that occur at least once with an expl:pass child. Examples: da să, face să, lua să, orândui să, vinde să, boteza să, chema să, ierta să, zice să, lăsa să, propovădui să, pune se, vesti să, arunca să, boteza mă, cere să, da -să, lua -să, vedea se, grăi să, ispiti să, naște să, omorî să, protimisi să, scrie să, turna se, tăia să, zălogi să, împărți să, ști să, adăuga să, cunoaște să, deschide să, erta să, face s-, ierta s-, lăsa -să, lăuda să, necinsti să, orîndui să, osândi să, pedepsi să, plăti să, preface să, risipi să, răstigni să, scoate să, strica să, trimite -să, vinde s
Verbs with Reflexive Core Objects
- This corpus contains 6 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: pune -și, face -și, ispiti se, smoli -și, trece iși, înșela și
Relations Overview
- This corpus uses 14 relation subtypes: advcl:tcl, advmod:tmod, aux:pass, cc:preconj, ccomp:pmod, csubj:pass, expl:impers, expl:pass, expl:poss, expl:pv, nmod:tmod, nsubj:pass, obl:agent, obl:pmod
- The following 2 relation types are not used in this corpus at all: dislocated, reparandum