UD Upper Sorbian UFAL
Language: Upper Sorbian (code: hsb
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.1 release.
The following people have contributed to making this treebank part of UD: Daniel Zeman, Anna Nedoluzhko.
Repository: UD_Upper_Sorbian-UFAL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: wiki, nonfiction
Questions, comments? General annotation questions (either Upper Sorbian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeman (æt) ufal • mff • cuni • cz]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
A small treebank of Upper Sorbian based mostly on Wikipedia.
The Upper Sorbian sentences are taken from the W2C corpus (Martin Majliš), which was further manually filtered, morphologically and syntactically annotated by Dan Zeman; lemmatization by Anna Nedoluzhko.
Sentences in the W2C corpus are shuffled.
Acknowledgments
Statistics of UD Upper Sorbian UFAL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdvType – Animacy – Case – Degree – Gender – Gender[psor] – Hyph – Mood – Number – Number[psor] – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – VerbType – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – dep – dep:alt – det – det:numgov – discourse – expl:pass – expl:pv – fixed – flat – flat:foreign – iobj – list – mark – nmod – nsubj – nsubj:pass – nummod – nummod:gov – obj – obl – orphan – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 646 sentences and 11196 tokens.
- This corpus contains 2133 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus does not contain words that contain both letters and punctuation.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: INTJ
- This corpus contains 3 word types tagged as particles (PART): hakle, jenož, nic
- This corpus contains 10 lemmas tagged as pronouns (PRON): ja, kiž, ništo, něšto, so, to, ty, wón, wšitko, štož
- This corpus contains 29 lemmas tagged as determiners (DET): jeho, jeje, jeju, jich, kajki, kotry, kotryž, kóždy, kóždyžkuli, mało, mnoho, naš, někajki, někotry, swój, tajki, tróšku, tudyši, tutón, twój, tójšto, tón, waš, wjele, wobaj, wšelaki, wšitki, wšě, žadyn
- This corpus contains 1 lemmas tagged as auxiliaries (AUX): być
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: być
- There are 4 (de)verbal forms:
- Conv
- VERB: dajo, měnjo, prajo, wobsahujo, wothladajo, zjednoćejo
- Fin
- AUX: je, su, bu, bě, buchu, by, njeje, njejsu, běchu, buštej
- VERB: ma, leži, móže, wobsahuje, móžeš, su, hlej, maja, rěči, běchu
- Inf
- AUX: być
- VERB: nastać, měć, pisać, přełožować, wobkedźbować, čitać, dać, definować, dopokazać, kliknyć
- Part
- ADJ: mjenowany, mjenowanych, namakane, rozdźělene, Zjednoćenych, listowany, mjenowane, natwarjene, pisane, přełožena
- AUX: był, była
- VERB: přewzali, wužiwali, započał, změnili, dodźeržała, eksistowali, ilustrował, kontrolowali, ležo, mał
Nominal Features
- Fem
- ADJ: serbskeje, wulku, druhe, serbska, wotpowědne, dalše, druhich, hornjej, kruta, němskej
- ADJ-Part: přełožena, přiběracu, rozdźělene, wušłe, Bywša, Namakane, Slědowace, běžace, charakerizowana, definowane
- ADV: wuchodne
- AUX-Part: była
- DET: n, kotraž, kotrež, tuta, swoju, tute, tutej, tutu, kotrejž, někotrych
- NOUN: l, rěč, woda, rěčow, stolica, rostliny, wody, rěče, knihi, biblioteki
- NUM: jedna, jednu, štyri, dwaj, dwě, dwěmaj, miliardow, woběmaj, štyrjoch
- PRON: wona, Jej, je, jeje, ju, njej, njeje, nju, wone
- PROPN: Mezopotamiskeje, Mezopotamiska, Mezopotamiskej, Wikimedia, Łužicy, Europje, Assyriska, Němskeje, Wikipedija, Africe
- VERB-Fin: předstaja
- VERB-Part: dodźeržała, eksistowali, kontrolowali, móhła, přeměniła, přełožili, přistupiła, rostła, stabilizowała, wróćiła
- Masc
- ADJ: serbski, prěni, Serbskeho, wulki, Ekscelentny, Serbskim, Třećeho, Zjednoćenych, ablawtowych, cyłym
- ADJ-Part: mjenowany, mjenowanych, Zjednoćenych, listowany, namakane, waženy, wobmjezowany, znaty, Přizjewjene, Rozhałžkowany
- AUX-Part: był
- DET: kotrež, kotryž, tutón, n, někotři, swoje, tute, tutym, kotrychž, někotre
- NOUN: př, kilometrow, nastawki, kraja, lěttysaca, čas, institut, stat, wobraz, časa
- NUM: jedyn, dwaj, Mio, dweju, jedneho, jedny, traje, štyrjoch
- PRON: wón, jón, Woni, je, jeho, kiž, nich, nim
- PROPN: Sumeričanow, Assur, Aššur, Babylon, Budyšinje, Hammurabi, Jakub, Ur, Akkada, Aramejčanow
- VERB-Fin: předstaja
- VERB-Part: přewzali, wužiwali, započał, ilustrował, mał, mjenował, měł, nastał, poradźił, poznamjenili
- Neut
- ADJ: najwjetše, wulke, klinowe, wuznamne, prěnje, Kaspiske, Kaspiskeho, aktualne, bjezdawkowe, běłe
- ADJ-Part: wupožčene, Přiběrace, Rozrostowace, barbjene, ekspandowaceho, florěrowace, mjenowane, nałožene, njeznate, nominowane
- DET: kotrež, tute, kóžde, žane, swoje, tajke, twojim, Wobě, kajke, kotrejž
- NOUN: město, lěta, lěće, mócnarstwo, pismo, słowo, lět, města, hospodarstwo, knjejstwa
- NUM: dwěmaj, jednym
- PRON: to, toho, tym, wono, wone, čimž, t, tomu, něšto, štož
- PROPN: Commons, Esperanto, Nadu, Slepo, Łobjom, Aleppo, Baku, Bangalore, Bengaluru, Esperanće
- VERB-Part: móhli, poradźiło, předstajili, stali, stało, wočakowało
- Anim
- ADJ: prěni, Moderni, Přizjewjene, Recentne, Stari, cuzych, europskich, južnoafriscy, małych, měšniscy
- ADJ-Part: Přizjewjene, njepřizjewjene, njewotemrěne, podćisnjeni, wuhnaći
- DET: někotři, kotřiž, wšěch, kotrymž, kotryž, někotrych, tutym, wšeho, wšitkim
- NOUN: krala, kralow, wobydlerjow, wužiwar, wužiwarjo, kral, ludźi, Historikarjo, wjerchow, Ratarjo
- NUM: jedny, jedyn
- PRON: Woni
- PROPN: Sumeričanow, Hammurabi, Jakub, Aramejčanow, Assyričenjo, Aššur, Bart, Che, Ernesto, Guevara
- VERB-Part: přewzali, ilustrował, mjenował, poznamjenili, přinošował, přišli, wotkryłoj, wužiwali, zawjedowali, zhonił
- Inan
- ADJ: prěni, słowjanske, archeologiske, dalše, ekscelentne, hódne, listowany, měšćanske, najstarše, namakane
- ADJ-Part: listowany, namakane, dalokosahace, deklarowane, koncentrowany, mjenowany, měnjace, nastajene, nastate, natwarjene
- DET: kotrež, tutón, kotryž, n, tute, kotrychž, někotre, swoje, tutym, wšě
- NOUN: př, kilometrow, nastawki, kraja, lěttysaca, čas, institut, stat, wobraz, časa
- NUM: jedyn, dwaj, Mio, dweju, jedneho, traje, štyrjoch
- PRON: je
- PROPN: Babylon, Budyšinje, Ur, Akkada, Budyšin, Frankfurt, London, Mnichow, Tigrisa, Uruk
- VERB-Fin: jewjetej, móžetej, předstaja
- VERB-Part: mał, poradźił, priwatizowali, přidźělitej, wotměł, wunamakował, započał, změnili
- Nhum
- ADJ: zymnokrejne
- NOUN: žiwochow, wjelk, cycakach, cycakow, jednobańkowcach, jednobańkowcy, konje, kotřiž, měchawcach, rjapnikow
- PRON: jeho
- Dual
- ADJ: dalšej, fotosynteizskej, přesunjenej, rozbiwanej, rozpušćenej, serbskej, sonantnej, wodźikoweju, wudospołnjatej, znatej
- ADJ-Part: přesunjenej, rozbiwanej, rozpušćenej, znatej, zničenej
- AUX-Fin: buštej, stej, běštej, staj
- DET: Wobě, jeju, kotrejž
- NOUN: měsacaj, rěkomaj, Kralej, atomaj, atomow, genusaj, izotopaj, kmjenaj, likwidaj, lětomaj
- NUM: dwaj, dwěmaj, dweju, dwě, woběmaj
- PRON: Wonej
- PROPN: Łužicomaj
- VERB-Fin: jewjetej, matej, móžetej, nabywaštej, rozšěrištaj, spěchowaštej, słušatej, začinitej
- VERB-Part: nahrawałoj, přidźělitej, wotkryłoj, wučerpałoj
- Plur
- ADJ: druhich, druhe, ablawtowych, dalše, wjacore, prěnje, wažne, wikowanske, wotpowědne, wulke
- ADJ-Part: mjenowanych, namakane, rozdźělene, Zjednoćenych, natwarjene, wupožčene, wušłe, znate, Planowane, Přiběrace
- ADV: wuchodne
- AUX-Fin: su, buchu, njejsu, běchu, bychu, njebuchu, njesu
- DET: kotrež, tute, wšě, někotrych, swoje, kotrychž, někotre, tutych, wšěch, někotři
- NOUN: rěčow, kilometrow, nastawki, rostliny, lět, knihi, města, rěče, statow, wobrazy
- NUM: Mio, miliardow
- PRON: je, wone, kiž, Woni, nam, nich, nimi
- PROPN: Sumeričanow, Aramejčanow, Assyričenjo, Serbow, Assyričanow, Geuzen, Milčanow, Serbach, Łužičanow, Alpow
- VERB-Fin: su, běchu, maja, eksistuja, móžachu, móžeja, pokazuja, wužiwachu, wužiwaja, hodźa
- VERB-Part: přewzali, wužiwali, změnili, eksistowali, kontrolowali, móhli, namakali, nastali, poznamjenili, priwatizowali
- Ptan
- NOUN: droždźemi, duri, hody, wiki
- PROPN: Drježdźanach, Drježdźany, Mułkecy, Wikach
- Sing
- ADJ: serbski, serbskeje, Serbskeho, najwjetše, prěni, wulki, wulku, klinowe, serbska, Ekscelentny
- ADJ-Part: mjenowany, listowany, přełožena, přiběracu, waženy, wobmjezowany, znaty, Bywša, Rozhałžkowany, Rozrostowace
- AUX-Fin: je, bu, bě, by, njeje, sy, budu, budźe
- AUX-Part: był, była
- DET: n, kotryž, kotraž, tutón, tuta, swoju, kotrež, tute, tutej, tutu
- NOUN: l, př, město, rěč, woda, lěta, stolica, lěće, mócnarstwo, pismo
- NUM: jedyn, jedna, jednu, jednym, jedneho, jedny
- PRON: to, toho, tym, wona, wón, wono, čimž, jón, t, tomu
- PROPN: Mezopotamiskeje, Mezopotamiska, Mezopotamiskej, Wikimedia, Łužicy, Europje, Assur, Assyriska, Aššur, Babylon
- VERB-Fin: ma, móže, wobsahuje, móžeš, hlej, leži, rěči, dyrbi, wužiwa, hodźi
- VERB-Part: započał, dodźeržała, ilustrował, mał, mjenował, móhła, měł, nastał, poradźił, poradźiło
- Acc
- ADJ: wulku, druhe, wotpowědne, prěni, prěnje, wikowanske, wulke, Klemenowu, bohatu, cyłe
- ADJ-Part: listowany, dalokosahace, florěrowace, koncentrowany, mjenowane, mjenowany, měnjace, njepřizjewjene, njeznate, pisane
- DET: swoje, swoju, tute, tutu, swój, kóžde, kóždy, wšě, wšěch, žane
- NOUN: př, rěč, nastawki, wobrazy, přikład, čas, dataje, lisćinu, móc, mócnarstwo
- NUM: dwaj, jednu, jedyn
- PRON: so, to, je, jeho, jón, něšto, ju, ničo, nju, wšitko
- PROPN: Esperanto, Mezopotamisku, Aziju, Babylon, Babylonsku, Fenicisku, Institut, Israel, Mnichow, Palestinu
- Dat
- ADJ: němskej, Delnjej, Hornjej, Indusowej, Jednotliwym, Ludowemu, Persiskemu, Popłatkowemu, ablawtowym, definowanym
- ADJ-Part: definowanym, zapřijatemu
- DET: kotrymž, swojemu, wšemu, wšitkim
- NOUN: akademiji, dispoziciji, rostlinam, wotrjadam, Wopytowarjam, delće, dnjej, drohoćinkam, ekliptice, embryofytam
- PRON: sej, tomu, nam, Jej, jeje, njej, sebi
- PROPN: Ešarrje, Francoskej, Hetitam, Leidenčanam, Mezopotamiskej, Serbam, Łužicy, Španiskej, Španičanam
- Gen
- ADJ: druhich, serbskeje, Serbskeho, ablawtowych, wědomostnych, Třećeho, Zjednoćenych, delnjeho, mjenowanych, persiskeho
- ADJ-Part: mjenowanych, Zjednoćenych, ekspandowaceho, mjenowaneje, nadrjadowanych, namjetowaceho, nastajeneho, normowanych, předstajeneho, předźěłaneje
- DET: tutych, tutoho, kotrychž, tych, kotrehož, kotrejež, kóždychžkuli, někajkeho, někotrych, swojeho
- NOUN: rěčow, lěta, kilometrow, wody, kraja, lěttysaca, lět, časa, biblioteki, instituta
- NUM: Mio, štyrjoch, dweju, jedneho, miliardow
- PRON: toho, nich, njeje
- PROPN: Mezopotamiskeje, Sumeričanow, Němskeje, Aramejčanow, Assyriskeje, Serbow, Syriskeje, Tigrisa, Łužicy, Akkada
- Ins
- ADJ: druhim, druhimi, jednotliwymi, nowymi, přiběracu, samsnym, Baltiskim, Kapadociskej, Persiskim, Prěnju
- ADJ-Part: přiběracu, podćisnjenymi, znatymi
- DET: n, swojimi, kotrymiž, swojej, tym
- NOUN: l, pomocu, ablawtom, družinami, hamorom, krajemi, kralom, ličakami, mjenom, rostlinami
- NUM: dwěmaj
- PRON: tym, sobu, nimi
- PROPN: Babylonom, Eufratom, Iranom, Solawu, Wódru, Łobjom, Anatolskej, Andrapradešom, Assyriskej, Awstriskej
- Loc
- ADJ: Serbskim, cyłym, sewjernej, babylonskej, chemiskich, druhej, historiskim, hornim, hornjej, južnej
- ADJ-Part: naspomnjenej, předstajenej, rěčanej, sćěhowacej, wužiwanej, ćišćanej
- DET: někotrych, tutej, tutym, kotrejž, kotrychž, swojich, twojim, wšěch, kotrymž, kóždym
- NOUN: lěće, času, rěči, běhu, dobje, formje, lětstotku, stronje, wodźe, zemi
- NUM: dwěmaj, jednym, woběmaj
- PRON: tym, čimž, nim
- PROPN: Europje, Budyšinje, Mezopotamiskej, Africe, Americe, Babylonje, Berlinje, Indiskej, Litawskej, Nižozemskej
- Nom
- ADJ: najwjetše, Serbski, wulki, klinowe, prěnje, serbska, wuznamne, Ekscelentny, dalše, druhe
- ADJ-Part: namakane, mjenowany, natwarjene, přełožena, waženy, wuwite, wušłe, znate, znaty, Bywša
- DET: kotrež, kotraž, kotryž, tute, tutón, tuta, někotre, wšě, někotři, Naš
- NOUN: město, woda, stolica, rostliny, institut, pismo, rěč, stat, dołhosć, dźeń
- NUM: jedyn, dwaj, jedna, dwě, jedny
- PRON: to, kiž, wona, wón, wone, wono, Woni, ty, štož, Wonej
- PROPN: Mezopotamiska, Assur, Assyriska, Aššur, Hammurabi, Jakub, Ur, Wikipedija, Assyričenjo, Babylon
Degree and Polarity
- Cmp
- ADJ: Dlěši, abstrakniše, efektiwniše, husćiša, jasniši, kompleksniše, mjeńšich, młódši, pozdźiše, starše
- ADV: bóle, wjace, dale, pozdźišo, mjenje, lěpje, rědšo, zašo, mjeńše
- DET: mjenje, wjace
- Pos
- ADJ: serbski, wulki, dalše, wotpowědne, wulke, Ekscelentny, ablawtowych, posledni, sewjernej, wuznamne
- ADJ-Part: Wobmjezowany, normowanych, rozšěrjeny, znaty, zwjazowane
- ADV: němsce, často, cirka, jara, geografisce, hłownje, awtomatisce, cyle, dołho, grjeksce
- DET: wjele, mnoho
- Sup
- ADJ: najwjetše, najwjetši, najmjeńši, najstarše, najwažniša, Najwažniše, najhusćiša, najnuzniša, najrjeńšim, najrozdźělnišich
- ADV: najprjedy, najbliže, najbóle, najskerje, najwjace
- DET: najwjace
- Neg
- ADJ: njedemokratiska, njeparujomna, njeparujomny, njeprawe, njepřizjewjene, njerozpušćomny, njewonjaty, njewotemrěne, njewotwisnych, njeznate
- ADJ-Part: njepřizjewjene, njewotemrěne, njeznate
- ADV: njederje, njesamostatnje
- AUX-Fin: njeje, njejsu, njebuchu, njesu
- PART: nic
- VERB-Fin: njesłuša, njeje, Njejsu, Njewědźeše, Njewěm, njeběchu, njeda, njefunguja, njeliča, njeliči
Verbal Features
- Cnd
- AUX-Fin: by, bychu
- Imp
- VERB-Fin: hlej, Pomhaj, wobroćće, wotstroń, wužiwaj
- Ind
- AUX-Fin: je, su, bu, bě, buchu, njeje, njejsu, běchu, buštej, stej
- VERB-Fin: ma, leži, móže, wobsahuje, móžeš, su, maja, rěči, běchu, dyrbi
- VERB-Part: ležo
- Fut
- AUX-Fin: budu, budźe
- VERB-Fin: budźe, budu
- Past
- ADJ-Part: wušłe, Bywša, Namakane, potrjechena, potrjechene, redukowane, rozdźělene, rozpušćenej, rozpušćeno, wobdate
- AUX-Fin: bu, bě, buchu, běchu, buštej, běštej, njebuchu
- AUX-Part: był, była
- VERB-Fin: běchu, móžachu, wužiwachu, bě, mjenowachu, měješe, naby, pisachu, skónči, wjedźechu
- VERB-Part: přewzali, wužiwali, započał, změnili, dodźeržała, eksistowali, ilustrował, kontrolowali, mał, mjenował
- Pres
- ADJ-Part: přiběracu, Přiběrace, Rozrostowace, Slědowace, běžace, dalokosahace, ekspandowaceho, florěrowace, měnjace, namjetowaceho
- AUX-Fin: je, su, njeje, njejsu, stej, sy, njesu, staj
- VERB-Conv: dajo, měnjo, prajo, wobsahujo, wothladajo, zjednoćejo
- VERB-Fin: ma, leži, móže, wobsahuje, móžeš, su, maja, rěči, dyrbi, wužiwa
- VERB-Part: ležo
- Act
- ADJ-Part: přiběracu, wušłe, Bywša, Přiběrace, Rozrostowace, Slědowace, běžace, dalokosahace, ekspandowaceho, florěrowace
- AUX-Part: był, była
- VERB-Part: přewzali, wužiwali, započał, změnili, dodźeržała, eksistowali, ilustrował, kontrolowali, mał, mjenował
- Pass
- ADJ-Part: mjenowany, mjenowanych, namakane, rozdźělene, Zjednoćenych, listowany, mjenowane, natwarjene, pisane, přełožena
- AUX-Fin: bu, buchu, buštej
- VERB-Fin: bu
Pronouns, Determiners, Quantifiers
- Dem
- ADV: tak, tu, potom, tam, nětko, potajkim, tohodla, Pódla, Tuchwilu, to
- DET: tute, tutón, tuta, tutu, tutych, tutej, tutym, tutoho, tych, tajke
- PRON: to, toho, tym, tomu, t
- Ind
- ADV: něhdźe, druhdy, wjace, něhdy, wjele, mjenje, tróšku, mjeńše, najwjace
- DET: wjele, někotrych, někotre, někotři, mnoho, wšelake, kóždychžkuli, mjenje, najwjace, někajke
- PRON: něšto
- Int,Rel
- ADV: kak
- Neg
- ADV: nihdźe
- DET: žane, žadyn, žana, žanu
- PRON: ničo
- Prs
- DET: n, jeho, jich, swoje, swoju, jeje, swojich, swój, Naš, swojej
- PRON: so, wona, wón, je, wone, wono, jón, sej, Woni, jeho
- Rel
- ADV: hdźež, čehoždla
- DET: kotrež, kotryž, kotraž, kotrychž, kotrejž, kotrymž, kotřiž, kajke, kotrehož, kotrejež
- PRON: kiž, čimž, štož
- Tot
- DET: wšě, wšěch, kóžde, kóždy, Kóždu, Wobě, kóždym, wšeho, wšemu, wšitke
- NUM: woběmaj
- PRON: wšitko
- Card
- ADV: wjace, wjele, mjenje, tróšku, mjeńše, najwjace
- DET: wjele, mnoho, Wobě, mjenje, najwjace, tróšku, tójšto, wjace
- NOUN: stopjeń, třoch
- NUM: 2, 1, 6, 4, 3, 5, 7, I, 000, 10
- Mult
- ADJ: dwójnu, trójnu
- Ord
- ADJ: prěni, prěnje, druhe, druhich, Třećeho, druhi, druhej, 50tych, Druheje, Druhu
- Yes
- DET: n, jeho, jich, swoje, swoju, jeje, swojich, swojimi, swój, Naš
- Yes
- DET: swoje, swoju, swojich, swojimi, swój, swojej, swojeho, swojeje, swojemu
- PRON: so, sej, sobu, sebi
- 1
- DET: n, Naš, naša, našej, našim
- PRON: nam
- VERB-Fin: prošu, móžemy, trjebamy, Njewěm, wothladamy, činju
- 2
- AUX-Fin: sy
- DET: twojim, Wašu
- PRON: ty
- VERB-Fin: móžeš, hlej, namakaš, Pomhaj, móžeće, chceće, dodaš, dyrbiš, namakaće, njenamakaš
- 3
- AUX-Fin: je, su, bu, bě, buchu, by, njeje, njejsu, běchu, buštej
- DET: jeho, jich, jeje, jeju
- PRON: wona, wón, je, wone, wono, jón, Woni, jeho, nim, Jej
- VERB-Fin: ma, leži, móže, wobsahuje, su, rěči, běchu, dyrbi, maja, wužiwa
- VERB-Part: ležo
- Fem
- DET: jeje
- Masc,Neut
- DET: jeho
- Dual
- DET: jeju
- Plur
- DET: n, jich, Naš, Wašu, naša, našej, našim
- Sing
- DET: jeho, jeje, twojim
Other Features
- Abbr
- Yes
- ADJ: d, jendź, mj, z
- ADJ-Part: mj, z
- ADP: př, n
- ADV: resp, atd, łać, jendź, t
- DET: n
- NOUN: l, př, km, m, CEST, hodź, jan, dr, nakł, přir
- NUM: III, Mio, 02625
- PRON: t
- PROPN: C, GNU, CET, KPD, OZN, H, ISGV, NDR
- SYM: O2, O3
- VERB-Fin: mj, r
- X: APG, DDR, PD, SORBISCHES, dr, m, mj
- Yes
- AdvType
- Mod
- ADV: móžno
- Mod
- Hyph
- Yes
- ADJ: němsko, Awstro, Tibeto, dołho, duchowno, hornjo, krótko, politisko, syrisko, zapado
- Yes
- VerbType
- Mod
- VERB-Fin: móže, móžeš, dyrbi, móžachu, ma, móža, móžeja, móžemy, móžeće, chce
- VERB-Part: móhli
- Mod
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: być.
- This corpus uses 1 lemmas as auxiliaries (aux). Examples: być.
- This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: być.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (5)
- VERB-Fin--NOUN-Gen (17)
- VERB-Fin--NOUN-Gen-ADP(wokoło) (1)
- VERB-Fin--NOUN-Nom (328)
- VERB-Fin--PRON-Nom (28)
- VERB-Inf--NOUN-Nom (2)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--NOUN-Nom (27)
- obj
- VERB-Conv--NOUN-Acc (1)
- VERB-Conv--NOUN-Gen (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Acc (176)
- VERB-Fin--NOUN-Acc-ADP(na) (9)
- VERB-Fin--NOUN-Acc-ADP(přez) (2)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Dat-ADP(k) (3)
- VERB-Fin--NOUN-Gen (12)
- VERB-Fin--NOUN-Gen-ADP(do) (1)
- VERB-Fin--NOUN-Gen-ADP(wot) (2)
- VERB-Fin--NOUN-Gen-ADP(z) (2)
- VERB-Fin--NOUN-Ins (1)
- VERB-Fin--NOUN-Ins-ADP(nad) (1)
- VERB-Fin--NOUN-Loc-ADP(na) (2)
- VERB-Fin--NOUN-Nom (10)
- VERB-Fin--NOUN-Nom-ADP(za) (1)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (15)
- VERB-Fin--PRON-Acc-ADP(na) (1)
- VERB-Fin--PRON-Loc-ADP(w) (1)
- VERB-Inf--NOUN-Acc (55)
- VERB-Inf--NOUN-Acc-ADP(na) (1)
- VERB-Inf--NOUN-Dat (1)
- VERB-Inf--NOUN-Dat-ADP(k) (2)
- VERB-Inf--NOUN-Gen (3)
- VERB-Inf--NOUN-Gen-ADP(do) (1)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--PRON-Acc (10)
- VERB-Inf--PRON-Loc-ADP(při) (1)
- VERB-Part--NOUN-Acc (9)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--PRON-Acc (4)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Fin--NOUN-Dat (5)
- VERB-Fin--PRON-Dat (3)
- VERB-Inf--NOUN-Dat (1)
- VERB-Inf--NOUN-Gen (1)
- VERB-Part--NOUN-Dat (1)
Reflexive Verbs
- This corpus contains 47 lemmas that occur at least once with an expl:pv child. Examples: hodźić so, mjenować so, hodźeć so, započeć so, skónčić so, stać so, wobdźělić so, wotměć so, dać so, dóstać so, jewić so, měnić so, poradźić so, posłužić so, rozeznawać so, wobroćić so, wuwiwać so, zdać so, koncentrować so, kónčić so, nahromadźić so, pohnuć so, pokazać so, postać so, přeměnić so, rěkać so, wobhladać sej, wobkedźbować so, wospjetować so, wotbłyšćować so, wotměwać so, wuznamjeni so, wuznamjenić so, wuznamjenjeć so, wěsći sej, zasydlić so, zawěrać so, załožić so, zběhnyć so, zepěrać so, zestajić so, zetkawać so, zhubić so, zjewić so, změnić so, zrozumić so, złožować so
Reflexive Passive
- This corpus contains 67 lemmas that occur at least once with an expl:pass child. Examples: rěčeć so, wužiwać so, dyrbjeć so, rozeznawać so, móc so, namakać so, pisać so, pokazać so, dodać so, ličić so, měć so, narunać so, tworić so, zhotowjeć so, Załožić so, ablawtować so, adaptować so, dodźeržeć so, dowěrjeć so, financować so, kombinować so, kultiwować so, měšeć so, namjetować so, napominać so, našćěpić so, podepřeć so, priwatizować so, předstajić so, přeměnjeć so, přesadźić so, přewjesć so, přewostajić so, přełožilić so, přidźělić so, přiličeć so, připoznać so, rozbić so, sadźeć so, skłonjować so, směć so, spřistupnjeć so, swjećić so, sćahnyć so, trjebać so, wobchować so, wobkedźbować so, wopłodźować so, wotměć so, wočakować so
Verbs with Reflexive Core Objects
- This corpus contains 16 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: formować so, mjenować so, měć so, pohrjebać so, pokazać so, přetworjować so, rozpušćeć so, stabilizować so, wobchadźeć so, wobdźělować so, wožiwić so, wudospołnjaty so, wužiwać so, započinacy so, zmjeńšować so, zwjazać so
Relations Overview
- This corpus uses 9 relation subtypes: advmod:emph, aux:pass, dep:alt, det:numgov, expl:pass, expl:pv, flat:foreign, nsubj:pass, nummod:gov
- The following 1 main types are not used alone, they are always subtyped: expl
- The following 5 relation types are not used in this corpus at all: vocative, dislocated, clf, goeswith, reparandum