Treebank Statistics: UD_Romanian-RRT: POS Tags: X
There are 74 X
lemmas (0%), 115 X
types (0%) and 161 X
tokens (0%).
Out of 16 observed tags, the rank of X
is: 7 in number of lemmas, 9 in number of types and 15 in number of tokens.
The 10 most frequent X
lemmas: _, 5a, American, alia, in, inter, metri_pătrați, -a, ACTIVE, Awards
The 10 most frequent X
types: 000, 500, 100, mp, 0, 2, 5a, American, K., alia
The 10 most frequent ambiguous lemmas: _ (X 82, NUM 2, PUNCT 1), 5a (ADV 3, X 2, NUM 1, PROPN 1), in (ADP 23, NOUN 1, X 1), -a (DET 23, X 1), Awards (PROPN 1, X 1), Book (PROPN 1, X 1), Klebsiella (PROPN 1, X 1), New (PROPN 7, X 1), al (DET 2845, X 1), car (NOUN 3, X 1)
The 10 most frequent ambiguous types: 000 (X 30, NUM 1), 500 (NUM 8, X 4), 100 (NUM 22, X 3), mp (NOUN 4, X 3), 0 (NUM 22, X 2), 2 (NUM 281, X 2), 5a (ADV 3, X 2, NUM 1, PROPN 1), dată (NOUN 76, VERB 6, X 2, ADJ 1), in (ADP 18, NOUN 1, X 1), un (DET 1610, NUM 16, X 2)
- 000
- 500
- 100
- mp
- 0
- NUM 22: Seringile conțin 0 , 5 ml ( 1000 UI ) soluție .
- X 2: ( 7 ) Liniile bugetare A- 3 0 2 3 și A- 3 0 2 9 din bugetul general al Uniunii Europene privind exercițiul 2003 și exercițiile precedente sunt destinate să susțină Forumul European al Tineretului și organizațiile neguvernamentale internaționale din domeniul tineretului .
- 2
- NUM 281: Vând apartament 2 camere , ultracentral , curat și spațios .
- X 2: ( 7 ) Liniile bugetare A- 3 0 2 3 și A- 3 0 2 9 din bugetul general al Uniunii Europene privind exercițiul 2003 și exercițiile precedente sunt destinate să susțină Forumul European al Tineretului și organizațiile neguvernamentale internaționale din domeniul tineretului .
- 5a
- ADV 3: ( c ) la punctul 2 litera ( d ) , cuvintele “ în articolele 4 și 5 “ se înlocuiesc cu cuvintele “ în articolele 4 , 5 și 5a “ ;
- X 2: ” ( 6 ) În articolul 7 alineatul ( 1 ) , primul paragraf se înlocuiește cu următorul text : “ ( 1 ) În vederea schimburilor , statele membre pot să autorizeze introducerea pe piață a animalelor destinate reproducerii sau a animalelor reproducătoare aflate la sfârșitul carierei , care au fost supuse , în cursul acestei cariere , unuia dintre tratamentele menționate în articolele 4 , 5 sau 5a și să autorizeze aplicarea de ștampile comunitare pe carnea provenită de la astfel de animale , dacă s- au respectat condițiile prevăzute în articolele 4 , 5 și 5a și termenele de așteptare prevăzute în autorizația de introducere pe piață .
- NUM 1: ” ( 5 ) La articolul 6 , alineatul ( 1 ) se înlocuiește cu următorul text : “ ( 1 ) Produsele hormonale și substanțele beta- agoniste a căror administrare la animalele de fermă este autorizată în conformitate cu articolele 4 , 5 sau 5a trebuie să îndeplinească cerințele prevăzute în Directiva 2001 / 82 / CE .
- PROPN 1: De asemenea , sunt necesare și unele modificări minore în redactare , ținând cont în special de înlocuirea unui anumit număr de directive cu Directiva 2001 / 82 / CE a Parlamentului European și a Consiliului din 6 noiembrie 2001 de instituire a unui cod comunitar referitor la medicamentele veterinare în vederea ( a ) introducerii pe piață a substanțelor enumerate în lista A din anexa II în vederea administrării la animale din orice specie ; ( b ) introducerii pe piață a substanțelor enumerate în lista B din anexa II în vederea administrării la animalele a căror carne și produse sunt destinate consumului uman în alte scopuri decât cele prevăzute în articolul 4 punctul 2 și în articolul 5a .
- dată
- NOUN 76: îl înfiora de fiecare dată .
- VERB 6: Acest lucru nu afectează demonstrația dată de Planck , în care nu intervine această energie de zero .
- X 2: O dată stăpân pe metoda lui , Rimbaud - asemănător și în această privință cu omul de știință - își propune să extrapoleze adevărurile experimentale dobândite .
- ADJ 1: În cursul acestor investigații am pornit de la ideea că o sintaxă a textului ar trebui să ofere posibilitatea de a distinge după criterii strict formale între texte și non- texte într- o limbă dată .
- in
- ADP 18: Nu s- au identificat in vivo conjugați de faza 2 ale nici unuia dintre compuși .
- NOUN 1: Pungașii scoaseră o basma groasă de in și -l legară pe tejghetar la ochi , de nu putea să zărească o rază de lumină .
- X 1: Ambele examene presupun prezentarea a cinci lucrări ( papers ) - Reading , Writing , English in use , Listening , Speaking .
- un
Morphology
The form / lemma ratio of X
is 1.554054 (the average of all parts of speech is 1.814756).
The 1st highest number of forms (44) was observed with the lemma “_”: -apune, 0, 000, 065, 100, 112, 2, 230, 2C9, 3, 307, 390, 391, 3A4, 400, 463, 500, 672, 720, 736, 770, 867, 898, 9, 900, 914, 957, 996, Dopa, G-CSF, VAMA, alpine, amiezei, dată, dopei, glicozidice, glicozidică, grabă, operativă, retinoizi, spre, un, una, zicochimice.
The 2nd highest number of forms (1) was observed with the lemma “-a”: -a.
The 3rd highest number of forms (1) was observed with the lemma “5a”: 5a.
X
occurs with 2 features: Foreign (31; 19% instances), Abbr (9; 6% instances)
X
occurs with 2 feature-value pairs: Abbr=Yes
, Foreign=Yes
X
occurs with 3 feature combinations.
The most frequent feature combination is _
(121 tokens).
Examples: 000, 500, 100, 0, 2, American, dată, un, -a, -apune
Relations
X
nodes are attached to their parents using 13 different relations: goeswith (82; 51% instances), flat (37; 23% instances), nmod (14; 9% instances), conj (8; 5% instances), appos (6; 4% instances), amod (3; 2% instances), dep (3; 2% instances), fixed (2; 1% instances), nsubj (2; 1% instances), case (1; 1% instances), obj (1; 1% instances), obl (1; 1% instances), root (1; 1% instances)
Parents of X
nodes belong to 11 different parts of speech: NUM (63; 39% instances), X (33; 20% instances), NOUN (31; 19% instances), PROPN (13; 8% instances), ADJ (7; 4% instances), ADV (5; 3% instances), VERB (4; 2% instances), DET (2; 1% instances), ADP (1; 1% instances), PRON (1; 1% instances), (1; 1% instances)
124 (77%) X
nodes are leaves.
10 (6%) X
nodes have one child.
14 (9%) X
nodes have two children.
13 (8%) X
nodes have three or more children.
The highest child degree of a X
node is 6.
Children of X
nodes are attached using 12 different relations: flat (28; 32% instances), punct (27; 31% instances), case (7; 8% instances), conj (5; 6% instances), nummod (5; 6% instances), det (4; 5% instances), cc (3; 3% instances), amod (2; 2% instances), fixed (2; 2% instances), nmod (2; 2% instances), advmod (1; 1% instances), appos (1; 1% instances)
Children of X
nodes belong to 10 different parts of speech: X (33; 38% instances), PUNCT (27; 31% instances), ADP (6; 7% instances), NUM (5; 6% instances), DET (4; 5% instances), PROPN (4; 5% instances), CCONJ (3; 3% instances), ADJ (2; 2% instances), NOUN (2; 2% instances), ADV (1; 1% instances)