Treebank Statistics: UD_Portuguese-Bosque: POS Tags: NUM
There are 842 NUM
lemmas (4%), 855 NUM
types (3%) and 4660 NUM
tokens (2%).
Out of 17 observed tags, the rank of NUM
is: 5 in number of lemmas, 5 in number of types and 13 in number of tokens.
The 10 most frequent NUM
lemmas: um, dois, milhão, três, mil, cento, quatro, cinco, 15, 30
The 10 most frequent NUM
types: um, dois, milhões, três, mil, uma, cento, duas, quatro, cinco
The 10 most frequent ambiguous lemmas: um (DET 3199, NUM 376, PRON 16, PROPN 3, ADP 2, ADV 1, NOUN 1), dois (NUM 349, NOUN 1), mil (NUM 190, ADP 1, NOUN 1), cento (NUM 132, NOUN 2, PROPN 1), cinco (NUM 84, PROPN 1), 30 (NUM 59, PROPN 1), 20 (NUM 50, PROPN 3), uma (NUM 47, ADP 12, DET 12, NOUN 4, SCONJ 2, PROPN 1), 1 (NUM 43, PROPN 13), 2 (NUM 33, PROPN 5)
The 10 most frequent ambiguous types: um (DET 1599, NUM 239, PRON 6, PROPN 3, ADP 2, ADV 1, NOUN 1), dois (NUM 222, NOUN 1), mil (NUM 188, ADP 1), uma (DET 1420, NUM 135, ADP 10, NOUN 3, PRON 3, PROPN 1), cento (NUM 132, NOUN 2, PROPN 1), cinco (NUM 77, PROPN 1), 30 (NUM 59, PROPN 1), 20 (NUM 50, PROPN 3), 1 (NUM 42, PROPN 13), 2 (NUM 33, PROPN 5)
- um
- DET 1599: Os anos 80 foram um divisor de águas em a industrialização brasileira .
- NUM 239: Cingapura acusa mais um americano
- PRON 6: Em o Brasil , essa atitude ainda depende de a iniciativa de cada um .
- PROPN 3: Acho importante notar que a Bienal mudou a maneira de conseguir patrocínio cultural em o país , que antes era feito a a base de o « me dá um dinheiro aí » .
- ADP 2: Cuba também está com a imagem um tanto abalada ( crise , êxodo por mar etc ) .
- ADV 1: mas existe em um outro , porque aí nunca assassinou a sua avó .
- NOUN 1: Se não se incomodarem um a o outro é porque há condições para partir para a fase seguinte .
- dois
- mil
- uma
- DET 1420: « Sou uma estrangeira em a França e você sabe como são as coisas aqui . »
- NUM 135: Para os « antigos » , o Che está prestes a morrer uma segunda vez .
- ADP 10: Com a mesma hombridade que exibe mais uma vez .
- NOUN 3: Estas imagens que publicamos de Cartier-Bresson , Robert Capa , Eve Arnold ou Dennis Stock , entre outros , demonstra , uma vez mais , a vocação totalizadora de a Magnum , a capacidade em acompanhar de perto fenómenos mais importantes de a história de a humanidade .
- PRON 3: A maior parte de as cerca de 260 pessoas desalojadas instalou então abrigos improvisados em uma de as ruas de a urbanização .
- PROPN 1: De a série Soluções , o « PC é mais que uma máquina de escrever » é o lançamento de a Ariadne ( 132 págs . )
- cento
- NUM 132: Em Madrid , o índice geral subiu 0,44 por cento .
- NOUN 2: Meyer publicou esta informação em um romance , que depois adaptou a o cinema , com o título justamente de « A Solução a sete e meio por cento » ( talvez haja melhor tradução para « The 7,5 per cent Solution » : « Uma Solução a sete e meio por cento » , « Sete e meio por cento de Solução » ? )
- PROPN 1: Meyer publicou esta informação em um romance , que depois adaptou a o cinema , com o título justamente de « A Solução a sete e meio por cento » ( talvez haja melhor tradução para « The 7,5 per cent Solution » : « Uma Solução a sete e meio por cento » , « Sete e meio por cento de Solução » ? )
- cinco
- 30
- 20
- 1
- 2
Morphology
The form / lemma ratio of NUM
is 1.015439 (the average of all parts of speech is 1.423840).
The 1st highest number of forms (3) was observed with the lemma “milhão”: mi, milhão, milhões.
The 2nd highest number of forms (2) was observed with the lemma “0”: 0, O.
The 3rd highest number of forms (2) was observed with the lemma “1”: 1, 1).
NUM
occurs with 4 features: NumType (4642; 100% instances), Number (183; 4% instances), Gender (166; 4% instances), ExtPos (14; 0% instances)
NUM
occurs with 13 feature-value pairs: ExtPos=NOUN
, ExtPos=NUM
, ExtPos=PROPN
, Gender=Fem
, Gender=Masc
, NumType=Card
, NumType=Frac
, NumType=Mult
, NumType=Ord
, NumType=Range
, NumType=Sets
, Number=Plur
, Number=Sing
NUM
occurs with 26 feature combinations.
The most frequent feature combination is NumType=Card
(4462 tokens).
Examples: um, dois, três, milhões, mil, uma, duas, quatro, cinco, 15
Relations
NUM
nodes are attached to their parents using 25 different relations: nummod (2645; 57% instances), flat (457; 10% instances), nmod (426; 9% instances), obl (338; 7% instances), conj (151; 3% instances), compound (133; 3% instances), obj (114; 2% instances), appos (90; 2% instances), nsubj (88; 2% instances), parataxis (77; 2% instances), root (56; 1% instances), fixed (21; 0% instances), nsubj:pass (14; 0% instances), flat:name (10; 0% instances), xcomp (10; 0% instances), iobj (8; 0% instances), list (7; 0% instances), advcl (3; 0% instances), orphan (3; 0% instances), acl:relcl (2; 0% instances), ccomp (2; 0% instances), obl:agent (2; 0% instances), acl (1; 0% instances), advmod (1; 0% instances), flat:foreign (1; 0% instances)
Parents of NUM
nodes belong to 13 different parts of speech: NOUN (2457; 53% instances), NUM (652; 14% instances), VERB (536; 12% instances), SYM (424; 9% instances), ADP (269; 6% instances), PROPN (170; 4% instances), (56; 1% instances), ADJ (46; 1% instances), DET (18; 0% instances), PRON (16; 0% instances), ADV (10; 0% instances), X (5; 0% instances), PART (1; 0% instances)
2805 (60%) NUM
nodes are leaves.
1065 (23%) NUM
nodes have one child.
448 (10%) NUM
nodes have two children.
342 (7%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 9.
Children of NUM
nodes are attached using 27 different relations: case (816; 25% instances), punct (596; 18% instances), nmod (565; 17% instances), flat (460; 14% instances), advmod (220; 7% instances), conj (142; 4% instances), cc (108; 3% instances), det (91; 3% instances), cop (63; 2% instances), nsubj (50; 2% instances), appos (41; 1% instances), acl:relcl (12; 0% instances), parataxis (12; 0% instances), advcl (11; 0% instances), nummod (10; 0% instances), amod (9; 0% instances), mark (8; 0% instances), acl (6; 0% instances), fixed (6; 0% instances), compound (5; 0% instances), ccomp (3; 0% instances), obl (3; 0% instances), xcomp (3; 0% instances), aux (2; 0% instances), flat:name (2; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances)
Children of NUM
nodes belong to 15 different parts of speech: ADP (824; 25% instances), NUM (652; 20% instances), PUNCT (596; 18% instances), NOUN (529; 16% instances), ADV (219; 7% instances), CCONJ (111; 3% instances), DET (96; 3% instances), AUX (65; 2% instances), PROPN (54; 2% instances), VERB (39; 1% instances), PRON (34; 1% instances), ADJ (11; 0% instances), SCONJ (8; 0% instances), SYM (7; 0% instances), X (1; 0% instances)