UD_Albanian-STAF
|
UD_Albanian-TSA
|
Tokenization and Word Segmentation
|
Tokenization and Word Segmentation
|
- This corpus contains 200 sentences, 3499 tokens and 3563 syntactic words.
|
- This corpus contains 60 sentences and 922 tokens.
|
- This corpus contains 421 tokens (12%) that are not followed by a space.
|
- This corpus contains 88 tokens (10%) that are not followed by a space.
|
- This corpus does not contain words with spaces.
|
- This corpus does not contain words with spaces.
|
- This corpus contains 4 types of words that contain both letters and punctuation. Examples: ç', s', ndalim-qarkullimit, t'
|
- This corpus contains 2 types of words that contain both letters and punctuation. Examples: s', t'
|
- This corpus contains 62 multi-word tokens. On average, one multi-word token consists of 2.03 syntactic words.
- There are 18 types of multi-word tokens. Examples: t'i, ia, ta, ma, m'u, t'u, iu, t'ia, ç'bëhet, S'ke, mu, s'jam, s'mora, s'më, t'ua, ç'arsye, ç'i, ç'nofkë.
|
|
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: SYM, X
|
Morphology
Tags
- This corpus uses 14 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: INTJ, SYM, X
|
- This corpus contains 28 word types tagged as particles (PART): Ish, Le, U, a, deri, do, dot, duke, e, edhe, i, jo, mbase, me, mos, mund, më, nuk, pa, po, për, që, s', se, së, t', të, vetëm
|
- This corpus contains 8 word types tagged as particles (PART): duke, madje, më, nuk, s', se, t', të
|
- This corpus contains 71 lemmas tagged as pronouns (PRON): Asnjer, ai, aj, ajo, asgjë, asi, askush, askënd, asnjë, asnjër, aso, ata, ato, atë, cila, cili, disa, diç, diçka, e, gjithçka, gjithë, i, im, ime, ka, kaq, kjo, kujt, kush, ky, kënd, këta, këto, këtë, mi, mua, më, na, ndonjë, ne, njenë, njeri, njëri, pak, që, sa, saj, shumë, sime, ti, tij, timeti, tjerash, tjetr, tjetri, tjetër, tonë, tyre, të, tënd, tërë, u, unë, vet, vete, vetë, ç', çdo, çfarë, çka
|
- This corpus contains 14 lemmas tagged as pronouns (PRON): ai, ajo, ata, cili, cilido, disa, gjithë, i, kjo, ky, ne, tij, tillë, tjetër
|
- This corpus contains 9 lemmas tagged as determiners (DET): e, i, nja, nje, një, pak, së, të, ë
|
- This corpus contains 3 lemmas tagged as determiners (DET): e, i, një
|
- Out of the above, 4 lemmas occurred sometimes as PRON and sometimes as DET: e, i, pak, të
|
- Out of the above, 1 lemmas occurred sometimes as PRON and sometimes as DET: i
|
- This corpus contains 4 lemmas tagged as auxiliaries (AUX): duhet, jam, kam, u
|
- This corpus contains 3 lemmas tagged as auxiliaries (AUX): jam, kam, u
|
- Out of the above, 3 lemmas occurred sometimes as AUX and sometimes as VERB: duhet, jam, kam
|
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: kam
|
|
|
|
- Ger
- VERB: intensifikuar, lëvizur
|
|
- Inf
- VERB: dashuruar, ndihmuar, rritur
|
- Part
- ADJ: hijerëndë, kureshtar, skuqur, vështirë
- VERB: bërë, filluar, thënë, mbyllur, ngjarë, hequr, marrë, përpjekur, vajtur, caktuar
|
- Part
- ADJ: njohur, aplikuar, avancuara, caktuar, caktuara, hapur, interesuar, orientuara, pashkruar, përhapur
- AUX: qenë
- VERB: arritur, bartur, krijuar, mbijetuar, mundësuar, ndryshuar, pastruar, pasur, përparuar
|
Nominal Features
|
Nominal Features
|
|
|
- Fem
- ADJ: bardhë, bukur, fundit, djathtë, parë, re, huaj, jashtëzakonshme, lodhun, majtë
- DET: e, të, së, i
- NOUN: ditë, sytë, Nëna, gjendjes, shtëpia, dorën, gjë, grua, herë, kohën
- PRON: e, kjo, i, ajo, ime, saj, kësaj, këto, sime, asaj
- PROPN: Shqipëri, Ervehenë, Linda, Marga, Margën, Margës, Shqipërisë, Vedat, shtunë
|
- Fem
- ADJ: komplekse, kryesore, njerëzore, sociale, Madhe, aplikuar, avancuara, caktuar, dendura, dixhitale
- ADJ-Part: aplikuar, avancuara, caktuar, hapur, orientuara, rritura
- DET: e, të, një, së
- NOUN: Dashuria, kohës, marrëdhënieve, mënyrë, politikat, shkencat, shoqëri, sjelljes, tregtinë, Bujqësia
- PRON: disa, e, gjitha, këto, Kjo, cilat, këtë, saj, ato, atë
- PROPN: Shqipëri, Britania, Evropës, Japoninë, Kinës, Korenë
|
- Masc
- ADJ: sigurt, bardhë, bukur, huaj, parë, ri, çmendur, Madh, ardhshëm, arsyeshëm
- DET: të, i, e, së
- NOUN: gjenerali, shi, fillim, prifti, babai, fund, krahasim, njeri, njerëzit, njerëzve
- PRON: i, e, ai, ky, tij, atë, cilët, im, ata, këtë
- PROPN: Ernesti, Ernestit, Vedati, Berti, Dizit, Ernest, Hadi, Hadin, Linda, Lorin
|
- Masc
- ADJ: rëndësishëm, madh, njohur, Anglez, Evropian, abstrakt, caktuara, drejtpërdrejtë, emocionalë, interesuar
- ADJ-Part: njohur, caktuara, interesuar, pashkruar, përhapur
- DET: i, të, një, së
- NOUN: Evolucioni, Ishulli, dramaturgu, njeriut, njerëz, qytetit, shtete, ushqimit, vend, Interesi
- PRON: Ata, i, tij, Ky, ai, cilitdo, disa, Këto, atyre, këtë
- PROPN: Bashkimit, Djui, Djuin, Manit, Norsëve, Ruso, Zhak, Zhan
|
|
|
|
|
- Plur
- ADJ: para, bardha, befta, devotshme, dinjitoze, dridhura, errëta, fshehura, fundit, fëmijësh
- AUX: kishin, kanë, ishin, janë, jemi, kam, keni, paskëshin
- DET: të, e, së
- NOUN: sytë, njerëz, njerëzit, njerëzve, ditë, ditët, përkujdesjet, rrethana, çaste, Bisedimet
- PRON: i, cilët, na, ata, këto, ato, ne, tjerë, tyre, Këta
- PROPN: Vedat
- VERB: gjejmë, dilnim, gjej, kalonin, prijnë, Dua, Kemi, Mbetemi, Mjafton, binden
|
- Plur
- ADJ: avancuara, dendura, emocionale, emocionalë, fiziologjike, fosile, greke, jetësore, kognitivë, kombëtare
- ADJ-Part: avancuara, njohur, orientuara, rritura
- AUX: janë, kanë
- DET: e
- NOUN: drejtimet, marrëdhënieve, njerëz, njerëzit, politikat, shkencat, shtete, Forcat, Format, Frutat
- PRON: disa, këto, Ata, cilat, gjitha, ato, atyre, i, këtyre, na
- PROPN: Norsëve
- VERB: kanë, Dëgjojmë, dëmtojnë, fillojnë, formuan, identifikojnë, japin, jetojnë, kenë, kthehen
|
- Sing
- ADJ: bardhë, bukur, fundit, parë, sigurt, djathtë, huaj, re, errët, gabuar
- AUX: ishte, është, kishte, ka, jam, isha, jesh, jetë, ketë, kisha
- DET: e, të, i, së
- NOUN: gjenerali, shi, Nëna, fillim, gjendjes, prifti, shtëpia, arsye, babai, borës
- PRON: e, i, më, unë, ai, kjo, tij, ky, ajo, atë
- PROPN: Ernesti, Ernestit, Shqipëri, Linda, Vedati, Berti, Dizit, Ernest, Ervehenë, Hadi
- VERB: di, tha, ka, ndodhesha, bëri, shfaq, bëhet, bën, dinte, kam
|
- Sing
- ADJ: rëndësishëm, kryesore, madh, sociale, Anglez, Evropian, Madhe, abstrakt, aplikuar, caktuar
- ADJ-Part: aplikuar, caktuar, caktuara, hapur, interesuar, njohur, pashkruar, përhapur
- AUX: është, ishte, ka
- NOUN: Dashuria, Evolucioni, Ishulli, dramaturgu, kohës, mënyrë, njeriut, qytetit, shoqëri, sjelljes
- PRON: e, këtë, tij, Kjo, Ky, ai, cilitdo, saj, atë, cila
- PROPN: Shqipëri, Bashkimit, Britania, Djui, Djuin, Evropës, Japoninë, Kinës, Korenë, Manit
- VERB: ka, kishte, mendohet, duhet, ekziston, formon, karakterizohet, konsiston, krijoi, kthehet
|
|
|
- Abl
- ADJ: fundit, jashtëzakonshme, mundshëm, okultë, porsaardhur
- DET: të, së
- NOUN: ditës, kohësh, dëshire, filtrash, gjendjes, gjeneralit, grash, humbjeje, humbjes, kafkës
- PRON: tyre, kësaj, meje, asaj, atyre, saj, tij, tim, tjerash, tjetrit
|
- Abl
- NOUN: gjinisë, komunikimit, ndryshimesh, person, problemi, shekujve
- PRON: cilitdo
|
- Acc
- ADJ: bardhë, djathtë, fundit, gabuar, majtë, parë, alternative, botërore, dashtun, dinjitoze
- DET: të, e, i
- NOUN: sytë, ditë, fillim, arsye, dorën, fund, kohën, mend, mendjen, pyetjen
- PRON: e, i, më, atë, këtë, mua, tjetër, të, saj, tij
- PROPN: Shqipëri, Berti, Ervehenë, Hadin, Lorin, Margën, Tibet, Vajazan
|
- Acc
- NOUN: drejtimet, mënyrë, shkencat, shtete, tregtinë, administrim, anë, armë, artikujt, bashkim
- PRON: e, këtë, atë, cilat, cilën, gjitha, i, këto, tillë, tjera
- PROPN: Shqipëri, Djuin, Japoninë, Korenë
|
|
|
- Dat
- DET: të
- NOUN: njerëzve, joshjeve, njeriu, ulërimës
- PRON: i, më, na, atij, gjitha, mua, ti, u
- PROPN: Ernestit
|
- Dat
- NOUN: formave, informacionit, procesit, përbërësit, përvojave
- PRON: i, atyre, na, u
|
- Gen
- ADJ: bardhë, ardhshëm, arsyeshëm, automobilistike, dashtunës, errët, jashtëzakonshme, para, plotë, ri
- DET: të, së
- NOUN: borës, gjendjes, vetëdijes, merimangës, njerkës, shoqërisë, Gjumit, Sirenave, aeroportit, armëve
- PRON: sime, asaj, cilës, im, jonë, kujt, kësaj, saj, tij, tjetrit
- PROPN: Varrit, Dizit, Ernestit, Shqipërisë, Vedatit
|
- Gen
- NOUN: kohës, marrëdhënieve, njeriut, qytetit, sjelljes, ushqimit, anëtarëve, djegies, edukimit, ekonomie
- PRON: tij, saj, cilitdo, gjitha, kësaj, këtyre, tjetër, tyre
- PROPN: Bashkimit, Evropës, Kinës, Manit, Norsëve
|
- Nom
- ADJ: bukur, huaj, parë, sigurt, bardhë, fundit, papritur, qetë, re, Madh
- DET: e, i, të
- NOUN: gjenerali, Nëna, prifti, shtëpia, babai, njeri, shi, vjeshta, dermani, fillimi
- PRON: unë, ai, kjo, ky, ajo, cilët, im, tij, ata, ime
- PROPN: Ernesti, Linda, Vedati, Ernest, Hadi, Marga, Margës, Parku, Vedat, shtunë
|
- Nom
- NOUN: Dashuria, Evolucioni, Ishulli, dramaturgu, Bujqësia, Buka, Familja, Forcat, Format, Frutat
- PRON: disa, Ata, këto, Kjo, Ky, ai, Cilat, ato, cila, gjitha
- PROPN: Britania, Djui, Ruso, Zhak, Zhan
|
|
|
|
|
- Def
- NOUN: gjenerali, sytë, Nëna, gjendjes, prifti, shtëpia, babai, dorën, kohën, mendjen
- PRON: tjerë, Ç', ka, mi, njena, sajin, tjerash, tjerëve
- PROPN: Ernesti, Ernestit, Linda, Vedati, Dizit, Ervehenë, Hadi, Hadin, Lorin, Marga
|
- Def
- NOUN: Dashuria, Evolucioni, Ishulli, dramaturgu, drejtimet, kohës, marrëdhënieve, njeriut, njerëzit, politikat
- PROPN: Bashkimit, Britania, Djui, Djuin, Evropës, Japoninë, Kinës, Korenë, Manit, Norsëve
|
- Ind
- DET: një, Nja
- NOUN: ditë, shi, fillim, arsye, fund, gjë, grua, herë, krahasim, mend
- PRON: tjetër, më, Asnjeri
- PROPN: Shqipëri, Berti, Ernest, Vajazan
|
- Ind
- NOUN: mënyrë, njerëz, shoqëri, shtete, vend, Karakteristikë, administrim, anë, anëtarë, armë
- PROPN: Shqipëri
|
Degree and Polarity
|
Degree and Polarity
|
|
|
- Pos
- ADJ: bardhë, bukur, fundit, parë, huaj, sigurt, djathtë, re, errët, gabuar
|
|
|
|
|
|
|
|
Verbal Features
|
Verbal Features
|
|
|
- Imp
- AUX: ishte
- VERB: kushtonte, mbanin, uli
|
- Imp
- AUX: janë, është, kanë, ishte, ka
- VERB: dashuruar, ka, kanë, kishte, mendohet, Dëgjojmë, duhet, dëmtojnë, ekziston, fillojnë
- VERB-Ger: lëvizur
- VERB-Inf: dashuruar
|
|
- Perf
- VERB: krijoi, ndihmuar, rritur
- VERB-Inf: ndihmuar, rritur
|
|
|
|
|
- Ind
- AUX: ishte, është, kishte, ka, jam, kishin, kanë, isha, ishin, janë
- VERB: di, tha, ka, ndodhesha, bëri, shfaq, bëhet, bën, dinte, dua
|
- Ind
- AUX: janë, është, kanë, ishte, ka
- VERB: ka, kanë, kishte, mendohet, Dëgjojmë, duhet, ekziston, fillojnë, formon, formuan
|
- Sub
- AUX: jesh, jetë, ketë, kesh
- VERB: gjejmë, bezdisë, dëgjojmë, hajë, hynte, jetë, ketë, krijojë, merrem, mërzis
|
- Sub
- VERB: dëmtojnë, kenë, kthehen, ndikojnë, shkruhen
|
|
|
- Past
- AUX: ishte, kishte, kishin, isha, ishin, kam, kisha, Duhej, paskej, paskëshin
- VERB: tha, ndodhesha, bëri, shfaq, dinte, pinte, vinte, buzëqeshte, desha, dija
|
- Past
- AUX: ishte
- VERB: kishte, formuan, intensifikuar, krijoi, kërkonin, morën, ndihmuar, nxiti, nënshtruan, përket
- VERB-Ger: intensifikuar
- VERB-Inf: ndihmuar, rritur
|
- Pres
- AUX: është, ka, jam, kanë, janë, jesh, jetë, ketë, Duhet, Ishte
- VERB: di, ka, bëhet, bën, dua, gjejmë, them, besoj, bie, duket
|
- Pres
- AUX: janë, është, kanë, ka
- VERB: dashuruar, ka, kanë, mendohet, Dëgjojmë, duhet, dëmtojnë, ekziston, fillojnë, formon
- VERB-Ger: lëvizur
- VERB-Inf: dashuruar
|
|
|
- Act
- AUX: ishte, është, kishte, ka, jam, kishin, kanë, isha, ishin, janë
- VERB: di, tha, ka, bëri, shfaq, dinte, dua, gjejmë, pinte, them
|
- Act
- AUX: janë, është, kanë, ishte, ka
- VERB: dashuruar, ka, kanë, kishte, Dëgjojmë, dëmtojnë, ekziston, fillojnë, formon, identifikojnë
- VERB-Ger: lëvizur
- VERB-Inf: dashuruar, ndihmuar, rritur
|
- Mid
- VERB: ndodhesha, bëhet, dukej, kujtua, çuditet, Duket, afrohet, bahet, bë, bëhej
|
|
- Pass
- VERB: damkosen, konsiderohen, mbahen, përfshihen, përjashtohen
|
- Pass
- VERB: mendohet, formuan, intensifikuar, karakterizohet, kthehet, kuptohet, mirren, njihet, nënshtruan, përcaktohet
- VERB-Ger: intensifikuar
|
|
|
Pronouns, Determiners, Quantifiers
|
Pronouns, Determiners, Quantifiers
|
|
|
|
|
- Dem
- PRON: kjo, ky, atë, këtë, kësaj, këto, ata, ato, ndonjë, Këta
|
- Dem
- PRON: këto, këtë, Kjo, Ky, ai, atë, kësaj, këtyre
|
|
|
- Ind
- PRON: asgjë, diçka, ndonjë, çdo, asnjë, askush, tjetër, tërë, gjithë, Asgja
|
- Ind
- PRON: Disa, tillë, tjera, tjetrin, tjetër
|
- Int
- PRON: ç', Kush, çfarë, Kënd, sa, Çka, kujt
|
|
- Prs
- PRON: e, i, më, unë, ai, tij, ajo, im, na, mua
|
- Prs
- PRON: Ata, tij, saj, Ai, Këto, ato, e, na, tyre, u
|
- Rel
- PRON: që, cilët, ç', cili, cilën, cilës
|
|
|
|
|
|
- Card
- NUM: dy, gjashtë, katër, pesëdhjetë, shtatë, tetë, tre
|
|
|
|
- Yes
- PRON: tij, im, saj, ime, tim, sime, time, timeti, tyre, mia
|
|
|
|
|
|
|
|
- 1
- AUX: jam, isha, kam, kisha, Duhej, jemi, ke, keni
- PRON: më, unë, im, na, mua, ime, tim, sime, e, ne
- VERB: ndodhesha, dua, gjejmë, kam, them, desha, dija, dilnim, gjej, hapa
|
- 1
- VERB: Dëgjojmë, lexojmë, përmend
|
- 2
- AUX: je
- PRON: ti, e, ty, të, tënd
- VERB: beso, ndihesh, shmangesh
|
|
- 3
- AUX: ishte, është, kishte, ka, kishin, kanë, ishin, janë, jesh, jetë
- PRON: e, i, ai, tij, ajo, saj, tyre, ata, të, atij
- VERB: di, tha, ka, bëri, shfaq, bëhet, bën, dinte, pinte, vinte
|
- 3
- AUX: janë, është, kanë, ishte, ka
- PRON: Cilat, ai, u
- VERB: ka, kanë, kishte, mendohet, duhet, dëmtojnë, ekziston, fillojnë, formon, formuan
|
|
|
|
|
|
|
Other Features
|
Other Features
|
- AdvType
- Cau
- Deg
- ADV: shumë, aq, sa, shpesh, aspak, pak, paku, përsëri, sado, tepër
- Loc
- ADV: ku, brenda, jashtë, Ja, aty, diku, këtu, natën, para, poshtë
- Man
- ADV: Pavarësisht, absolutisht, aktualisht, instinktivisht, jashtëzakonisht, kështu, këtu, mirë, parasysh, pas
- Tim
- ADV: gjithmonë, sot, ndoshta, pastaj, atëherë, ende, Bashkë, Kurrë, Kështu, Para
|
|
|
- NounType
- Het
- NOUN: qytetit, shtete, vend, Problemet, Qytetet, Qëndrimet, anketimi, brez, drejtimet, dyqanet
|
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: jam.
|
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: jam.
|
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: kam, u, jam, duhet.
|
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: kam, u, jam.
|
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (2)
- VERB--NOUN-Acc (4)
- VERB--NOUN-Acc-ADP(në) (1)
- VERB--NOUN-Nom (78)
- VERB--PRON (20)
- VERB--PRON-Acc (1)
- VERB--PRON-Nom (42)
- VERB-Part--NOUN-Nom (6)
- VERB-Part--PRON (5)
- VERB-Part--PRON-Nom (8)
|
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Nom (34)
- VERB--PRON-Acc (1)
- VERB--PRON-Nom (7)
- VERB-Part--NOUN-Nom (5)
|
- obj
- VERB--NOUN (5)
- VERB--NOUN-Acc (74)
- VERB--NOUN-Nom (17)
- VERB--PRON (24)
- VERB--PRON-Acc (61)
- VERB--PRON-Dat (1)
- VERB--PRON-Nom (2)
- VERB-Part--NOUN-Acc (20)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON (2)
- VERB-Part--PRON-Acc (15)
- VERB-Part--PRON-Dat (1)
- VERB-Part--PRON-Nom (1)
|
- obj
- VERB--NOUN (1)
- VERB--NOUN-Acc (24)
- VERB--NOUN-Dat (2)
- VERB--NOUN-Nom (1)
- VERB--PRON-Acc (1)
- VERB-Ger--NOUN-Acc (1)
- VERB-Inf--NOUN-Acc (2)
- VERB-Part--NOUN-Acc (1)
|
- iobj
- VERB--NOUN-Abl (1)
- VERB--NOUN-Acc (1)
- VERB--NOUN-Dat (4)
- VERB--PRON (6)
- VERB--PRON-Acc (20)
- VERB--PRON-Dat (37)
- VERB--PRON-Nom (3)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--PRON (1)
- VERB-Part--PRON-Acc (4)
- VERB-Part--PRON-Dat (8)
|
|
|
|
|
|
Verbs with Reflexive Core Objects
- This corpus contains 1 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: pyes veten
|
|
Relations Overview
- This corpus uses 9 relation subtypes: acl:relcl, det:adj, det:poss, det:pron, nmod:poss, nsubj:outer, nsubj:pass, obl:agent, obl:tmod
- The following 9 relation types are not used in this corpus at all: vocative, expl, dislocated, clf, list, orphan, goeswith, reparandum, dep
|
Relations Overview
- This corpus uses 6 relation subtypes: acl:relcl, csubj:pass, det:adj, det:noun, det:pron, nmod:poss
- The following 1 main types are not used alone, they are always subtyped: acl
- The following 9 relation types are not used in this corpus at all: vocative, dislocated, discourse, clf, list, parataxis, goeswith, reparandum, dep
|