Treebank Statistics: UD_Italian-PoSTWITA: POS Tags: DET
There are 45 DET
lemmas (0%), 143 DET
types (1%) and 14476 DET
tokens (12%).
Out of 16 observed tags, the rank of DET
is: 13 in number of lemmas, 12 in number of types and 3 in number of tokens.
The 10 most frequent DET
lemmas: il, uno, questo, tutto, mio, suo, che, tuo, nostro, quello
The 10 most frequent DET
types: il, la, i, l’, un, le, una, gli, lo, che
The 10 most frequent ambiguous lemmas: il (DET 11006, PROPN 5, PRON 2), uno (DET 1573, PRON 64, NUM 6), questo (DET 307, PRON 102), tutto (PRON 474, DET 274, ADJ 1), mio (DET 205, PRON 15, ADJ 13, INTJ 1), suo (DET 167, PRON 12, ADJ 2), che (SCONJ 802, PRON 704, DET 162, ADP 19, PROPN 5, CCONJ 3), tuo (DET 80, PRON 9, ADJ 2), nostro (DET 78, PRON 2), quello (PRON 193, DET 61)
The 10 most frequent ambiguous types: il (DET 3956, PROPN 5), la (DET 2320, PRON 142, PROPN 10, ADP 1, X 1), i (DET 1152, INTJ 5, PROPN 3, X 3, PRON 1), l’ (DET 941, PRON 71, PROPN 2), le (DET 788, PRON 52, PROPN 1), una (DET 417, PRON 11), gli (DET 300, PRON 61), lo (PRON 302, DET 145, PROPN 1), che (SCONJ 762, PRON 660, DET 114, ADP 19, PROPN 5, CCONJ 3, X 1), tutti (PRON 247, DET 120)
- il
- la
- DET 2320: a il via la fase due di il governo #Monti : la risata satanica .
- PRON 142: @user si cazzo c’ è la devo fare c’ è la posso fare !
- PROPN 10: @user attacca le cronache di la Stampa e Repubblica su Mario Monti #serviziopubblico
- ADP 1: quando penso la la governo #Monti mi viene in mente #longanesi e il suo ci salveranno le vecchie zie rileggete lo se potete …
- X 1: @user abiamo cancellato contatti da pc . li ho su iphone . con sincro perdo tutto . devo importare da iphone su outlook ma non ghe la fò !
- i
- DET 1152: @user ma me dici che hai fatto ?? xk hai messo i puntini ?
- INTJ 5: @user vabbe i .. un giorno riusciremo anche noi a veder li
- PROPN 3: Siamo già a le minacce – Attacco a #Grillo | Italia i Dolori : http://t.co/lrlH9EAU via @user
- X 3: RT @user : se anche tu vorresti abbracciare il tuo / oi idolo / i #rt segui mi e ti seguo ♥ x22
- PRON 1: @user lillii i need cure speciali di la giuly ! è stata una pasqua difficile .
- l’
- le
- una
- gli
- lo
- che
- SCONJ 762: @user il tuo moroso sa che oggi si tornava a scuola ?!
- PRON 660: @user ma me dici che hai fatto ?? xk hai messo i puntini ?
- DET 114: @user che maga , inchiniamo ci HHAHAHAH
- ADP 19: Altro che Governo Monti , è già tempo di campagna elettorale .
- PROPN 5: dimenticavo ! Grande Mario Monti a che tempo che fa !
- CCONJ 3: ho più brufoli che faccia . ben mi sta , cazzo di Nutella porco dio .
- X 1: #Grillo non è la #Lega di il 2012 . Parlate per che sentite a la tv magari bersani che dice “ che non si permetta “ . E senno che fa bersani ? vince ? xD
- tutti
Morphology
The form / lemma ratio of DET
is 3.177778 (the average of all parts of speech is 1.310684).
The 1st highest number of forms (16) was observed with the lemma “il”: Lle, a, e, gli, i, il, in, io, kol, l, l’, la, le, li, ll, lo.
The 2nd highest number of forms (12) was observed with the lemma “questo”: qs, qst, quest’, questa, queste, questi, questo, sta, ste, sti, sto, stà.
The 3rd highest number of forms (8) was observed with the lemma “uno”: 1, n, n’, na, un, un’, una, uno.
DET
occurs with 5 features: PronType (14473; 100% instances), Number (13426; 93% instances), Definite (12578; 87% instances), Gender (12308; 85% instances), Poss (600; 4% instances)
DET
occurs with 14 feature-value pairs: Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Exc
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Tot
DET
occurs with 33 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Masc|Number=Sing|PronType=Art
(4770 tokens).
Examples: il, lo, del
Relations
DET
nodes are attached to their parents using 22 different relations: det (13660; 94% instances), det:poss (592; 4% instances), det:predet (144; 1% instances), dep (13; 0% instances), amod (12; 0% instances), obj (9; 0% instances), nmod (8; 0% instances), obl (8; 0% instances), conj (5; 0% instances), parataxis (4; 0% instances), root (4; 0% instances), appos (3; 0% instances), discourse (2; 0% instances), flat:name (2; 0% instances), nsubj (2; 0% instances), xcomp (2; 0% instances), acl:relcl (1; 0% instances), advcl (1; 0% instances), ccomp (1; 0% instances), fixed (1; 0% instances), obl:agent (1; 0% instances), parataxis:hashtag (1; 0% instances)
Parents of DET
nodes belong to 14 different parts of speech: NOUN (11603; 80% instances), PROPN (1387; 10% instances), SYM (733; 5% instances), PRON (176; 1% instances), ADJ (156; 1% instances), NUM (155; 1% instances), X (113; 1% instances), VERB (67; 0% instances), ADV (58; 0% instances), INTJ (19; 0% instances), (4; 0% instances), ADP (2; 0% instances), DET (2; 0% instances), AUX (1; 0% instances)
14414 (100%) DET
nodes are leaves.
44 (0%) DET
nodes have one child.
9 (0%) DET
nodes have two children.
9 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 4.
Children of DET
nodes are attached using 17 different relations: punct (32; 34% instances), case (18; 19% instances), nsubj (7; 8% instances), advmod (6; 6% instances), conj (6; 6% instances), cop (6; 6% instances), cc (4; 4% instances), advcl (3; 3% instances), aux (2; 2% instances), mark (2; 2% instances), appos (1; 1% instances), dep (1; 1% instances), flat:name (1; 1% instances), iobj (1; 1% instances), nmod (1; 1% instances), parataxis (1; 1% instances), vocative (1; 1% instances)
Children of DET
nodes belong to 15 different parts of speech: PUNCT (32; 34% instances), ADP (18; 19% instances), AUX (8; 9% instances), ADV (6; 6% instances), NOUN (6; 6% instances), CCONJ (4; 4% instances), VERB (4; 4% instances), SYM (3; 3% instances), ADJ (2; 2% instances), DET (2; 2% instances), PRON (2; 2% instances), SCONJ (2; 2% instances), X (2; 2% instances), NUM (1; 1% instances), PROPN (1; 1% instances)