Treebank Statistics: UD_Italian-VIT: POS Tags: DET
There are 50 DET
lemmas (0%), 121 DET
types (0%) and 43907 DET
tokens (16%).
Out of 17 observed tags, the rank of DET
is: 11 in number of lemmas, 10 in number of types and 3 in number of tokens.
The 10 most frequent DET
lemmas: il, uno, questo, suo, tutto, loro, quello, nostro, tale, ogni
The 10 most frequent DET
types: il, la, l’, i, le, un, gli, una, lo, questo
The 10 most frequent ambiguous lemmas: il (DET 36099, PRON 5, PUNCT 1, X 1), uno (DET 4151, PRON 122, NUM 45, ADJ 3, ADV 3), questo (DET 682, PRON 203), suo (DET 590, PRON 12), tutto (DET 380, PRON 189, ADV 28, ADJ 4, NOUN 3), loro (DET 187, PRON 49), quello (PRON 654, DET 186), nostro (DET 180, PRON 5), tale (DET 174, ADJ 28, PRON 6, ADV 1), ogni (DET 160, ADV 3, PRON 2, ADJ 1)
The 10 most frequent ambiguous types: la (DET 8093, PRON 118, X 1), l’ (DET 4759, PRON 93, ADV 1, NOUN 1), i (DET 4590, NUM 13), le (DET 3916, PRON 52, NOUN 1, PUNCT 1), un (DET 2035, NUM 10, PRON 1), gli (DET 1568, PRON 78), una (DET 1565, PRON 47, NUM 6, ADJ 2, ADV 2), lo (DET 577, PRON 217, ADV 2), questo (DET 215, PRON 98), un’ (DET 232, NUM 15)
- la
- l’
- DET 4759: Ha l’ acqua calda , più o meno si veste .
- PRON 93: Ma la musica italiana Caetano come l’ ha scoperta ?
- ADV 1: non si vede l’ ora che la statua parli .
- NOUN 1: A margine di la indicazione di i plessi verrà riportata la dizione “ con posti istituiti ex art. 1 l’ 820 “ se si attuano in essi le attività di cui a la legge medesima .
- i
- le
- DET 3916: E che cosa fanno i dirigenti in le ore d’ ufficio ?
- PRON 52: Forse non le era piaciuto , chissà .
- NOUN 1: A la rotonda di Ostia , p le C Colombo .
- PUNCT 1: Le magliette con la scritta “ no a il nucleare “ vanno a ruba , ricompaiono , da chissà dove , quelle con il sole che dicono “ nucleare , no grazie “ , le spillette , i “ no Nukes “ adesivi .
- un
- DET 2035: in riunioni non previste , per un altro 10 per cento ;
- NUM 10: I banditi sono entrati e l’ hanno rapinata di un milione di lire .
- PRON 1: In il secondo , invece , scrive di essere stato convocato in procura , in l’ ufficio antro di il magistrato e aver poi partecipato a una cena molto colorita , con Di Pietro e numerosi suoi futuri indagati che si rinfacciavano l’ un l’ altro varie malefatte .
- gli
- una
- DET 1565: non è una giornata qualunque .
- PRON 47: Le notti di Cabiria è una di le cose più belle che abbia mai visto .
- NUM 6: A l’ una e cinquantadue minuti , il primo sparo .
- ADJ 2: I predetti trasferimenti vengono disposti per compensazione tra l’ una e l’ altra provincia e quindi anche tra più provincie per scambi plurimi considerando tutte le possibilità di movimento di insegnanti da provincia a provincia che consentano il maggior numero di scambi di i trasferiti .
- ADV 2: Si comincia a Milano in settembre con l’ orchestra sinfonica Nhk , una di le più importanti in Giappone , nata a Tokyo in il 1926 .
- lo
- questo
- un’
Morphology
The form / lemma ratio of DET
is 2.420000 (the average of all parts of speech is 1.502411).
The 1st highest number of forms (7) was observed with the lemma “il”: gli, i, il, l’, la, le, lo.
The 2nd highest number of forms (7) was observed with the lemma “quello”: quegli, quei, quel, quell’, quella, quelle, quello.
The 3rd highest number of forms (6) was observed with the lemma “molto”: molta, molte, molti, moltissime, moltissimi, molto.
DET
occurs with 6 features: PronType (43899; 100% instances), Number (43743; 100% instances), Definite (40251; 92% instances), Gender (37731; 86% instances), Poss (1227; 3% instances), Degree (2; 0% instances)
DET
occurs with 16 feature-value pairs: Definite=Def
, Definite=Ind
, Degree=Abs
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Exc
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 51 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Masc|Number=Sing|PronType=Art
(11656 tokens).
Examples: il, lo, un, gli, i, l’
Relations
DET
nodes are attached to their parents using 7 different relations: det (42267; 96% instances), det:poss (1275; 3% instances), det:predet (359; 1% instances), conj (3; 0% instances), advmod (1; 0% instances), fixed (1; 0% instances), nsubj (1; 0% instances)
Parents of DET
nodes belong to 12 different parts of speech: NOUN (38293; 87% instances), PROPN (2931; 7% instances), NUM (1036; 2% instances), PRON (505; 1% instances), ADJ (396; 1% instances), SYM (394; 1% instances), VERB (131; 0% instances), X (114; 0% instances), ADV (71; 0% instances), ADP (31; 0% instances), DET (3; 0% instances), CCONJ (2; 0% instances)
43855 (100%) DET
nodes are leaves.
49 (0%) DET
nodes have one child.
3 (0%) DET
nodes have two children.
The highest child degree of a DET
node is 2.
Children of DET
nodes are attached using 7 different relations: advmod (38; 69% instances), punct (6; 11% instances), conj (5; 9% instances), cc (2; 4% instances), obl (2; 4% instances), amod (1; 2% instances), fixed (1; 2% instances)
Children of DET
nodes belong to 8 different parts of speech: ADV (38; 69% instances), PUNCT (6; 11% instances), DET (3; 5% instances), NOUN (3; 5% instances), CCONJ (2; 4% instances), ADJ (1; 2% instances), PRON (1; 2% instances), SYM (1; 2% instances)