Treebank Statistics: UD_Portuguese-PetroGold: POS Tags: DET
There are 38 DET
lemmas (0%), 93 DET
types (1%) and 36346 DET
tokens (15%).
Out of 16 observed tags, the rank of DET
is: 10 in number of lemmas, 8 in number of types and 3 in number of tokens.
The 10 most frequent DET
lemmas: o, um, este, seu, esse, todo, outro, cada, algum, tal
The 10 most frequent DET
types: a, o, os, as, um, uma, este, esta, sua, estes
The 10 most frequent ambiguous lemmas: o (DET 28989, PRON 460, ADJ 4, NOUN 2, ADP 1, ADV 1, SYM 1), um (DET 2760, PRON 120, NUM 49), este (DET 1852, PRON 208), esse (DET 473, PRON 6), todo (DET 240, PRON 9), outro (DET 218, PRON 72), cada (DET 162, NOUN 3), algum (DET 142, PRON 26), tal (DET 122, ADV 7, PRON 3), diverso (DET 78, ADJ 24)
The 10 most frequent ambiguous types: a (DET 10528, ADP 3222, PRON 99, CCONJ 73, SCONJ 20, NOUN 4, NUM 3, ADV 2, PROPN 2, VERB 1), o (DET 9847, PRON 283), os (DET 3084, PRON 43), as (DET 2591, PRON 27, ADP 1), um (DET 1351, PRON 54, NUM 27), uma (DET 1295, PRON 47, NUM 21), este (DET 635, PRON 76), esta (DET 468, PRON 45, AUX 1), estes (DET 207, PRON 37), estas (DET 123, PRON 20)
- a
- DET 10528: c ) Verificar a eficiência de a barreira de contenção de garrafas
- ADP 3222: 2.5 Técnicas para a Resposta a o Vazamento de Óleo
- PRON 99: Estes resultados podem ser observados em as Figuras 4.29 ( a ) e ( b ) .
- CCONJ 73: Em o mapa , correspondem a os afloramentos 194 a 206 ( Figura 21 ) .
- SCONJ 20: Notou se que quando há o predomínio de folhelhos a laminação tende a ser monótona .
- NOUN 4: Diminuição de a : concentração de concreções .
- NUM 3: Figura 12 – Análise de a área superficial de o catalisador TA ( a ) sem calcinar e ( b ) calcinado
- ADV 2: O procedimento descrito a cima também foi realizado para os outros dois poços presentes em a área .
- PROPN 2: Em as Figuras 2.4 ( a ) e 2.4 ( b ) têm se , respectivamente , a folha de silicato tetraédrica e a folha central octaédrica .
- VERB 1: Por a análise de os resultados obtidos , percebe se que a uma maior viscosidade para o óleo residual , este resultado é provavelmente a presença de sebo bolvino que possuem ácidos graxos insaturados e a o fritar estes tipos de alimentos mudam a composição de o óleo , aumentando assim a viscosidade .
- o
- os
- as
- DET 2591: 2.2.4 O Fluxo Costeiro e as Interferências Humanas
- PRON 27: Argilas de esse tipo são as encontradas em o Brasil .
- ADP 1: As vantagens de este tipo de tecnologia para este cenário são : necessidade reduzida de trabalhadores atuando diretamente em a exploração de o que em relação as plataformas tradicionais ( reduzindo o perigo imediato a a vida humana ) e o fato de poder contornar as temperaturas de congelamento em esta região , uma vez que a água perto de o fundo de o mar ainda é suficientemente quente para se evitar o congelamento , diferente de a temperatura em a superfície .
- um
- uma
- este
- esta
- DET 468: Com isso , esta propriedade é de fundamental importância .
- PRON 45: Portanto , esta seria uma hipótese plausível para explicar os dados .
- AUX 1: Dependendo de a região ( on-shore/off-shore ) , de o país em a qual esta sendo realizada a perfuração , de a legislação em vigor , de as características de Condições ambientais disposição final , esses fatores influenciam em a determinação a de um fluido quando se relaciona com as questões ambientais .
- estes
- estas
Morphology
The form / lemma ratio of DET
is 2.447368 (the average of all parts of speech is 1.452143).
The 1st highest number of forms (6) was observed with the lemma “este”: Deste, esta, estas, este, estes, está.
The 2nd highest number of forms (5) was observed with the lemma “o”: a, as, o, os, á.
The 3rd highest number of forms (5) was observed with the lemma “pouco”: menos, pouca, poucas, pouco, poucos.
DET
occurs with 4 features: Gender (36346; 100% instances), Number (36346; 100% instances), PronType (36345; 100% instances), Definite (31786; 87% instances)
DET
occurs with 14 feature-value pairs: Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, PronType=Art
, PronType=Dem
, PronType=Emp
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 36 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Fem|Number=Sing|PronType=Art
(11711 tokens).
Examples: a, , µ, á
Relations
DET
nodes are attached to their parents using 10 different relations: det (35582; 98% instances), flat:name (365; 1% instances), fixed (268; 1% instances), mark (60; 0% instances), case (41; 0% instances), obl (12; 0% instances), advmod (10; 0% instances), conj (5; 0% instances), appos (2; 0% instances), amod (1; 0% instances)
Parents of DET
nodes belong to 12 different parts of speech: NOUN (33050; 91% instances), PROPN (2500; 7% instances), ADP (258; 1% instances), PRON (247; 1% instances), VERB (124; 0% instances), ADJ (114; 0% instances), NUM (19; 0% instances), ADV (10; 0% instances), SYM (10; 0% instances), DET (7; 0% instances), X (6; 0% instances), PUNCT (1; 0% instances)
36218 (100%) DET
nodes are leaves.
57 (0%) DET
nodes have one child.
70 (0%) DET
nodes have two children.
1 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 4.
Children of DET
nodes are attached using 5 different relations: fixed (188; 94% instances), cc (5; 2% instances), punct (5; 2% instances), conj (2; 1% instances), nmod (1; 0% instances)
Children of DET
nodes belong to 8 different parts of speech: NOUN (71; 35% instances), SCONJ (61; 30% instances), ADP (40; 20% instances), ADV (10; 5% instances), DET (7; 3% instances), CCONJ (5; 2% instances), PUNCT (5; 2% instances), ADJ (2; 1% instances)