Treebank Statistics: UD_Catalan-AnCora: POS Tags: PROPN
There are 10040 PROPN
lemmas (39%), 10043 PROPN
types (27%) and 46590 PROPN
tokens (9%).
Out of 16 observed tags, the rank of PROPN
is: 1 in number of lemmas, 1 in number of types and 5 in number of tokens.
The 10 most frequent PROPN
lemmas: Catalunya, barcelona, generalitat, Govern, sant, ajuntament, Girona, Josep, CiU, PP
The 10 most frequent PROPN
types: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
The 10 most frequent ambiguous lemmas: generalitat (NOUN 2, PROPN 1), sant (NOUN 3, ADJ 1, PROPN 1), ajuntament (NOUN 143, PROPN 1), estat (NOUN 123, PROPN 5), consell (NOUN 68, PROPN 3), cultura (NOUN 78, PROPN 4), ambient (NOUN 40, PROPN 24, ADJ 3), medi (NOUN 34, PROPN 22), civil (ADJ 52, NOUN 3, PROPN 1), general (ADJ 297, NOUN 25, PROPN 1)
The 10 most frequent ambiguous types: Catalunya (PROPN 781, NOUN 1), Govern (PROPN 442, NOUN 1), sant (NOUN 2, PROPN 1), Ajuntament (PROPN 295, NOUN 2), estat (AUX 542, NOUN 103, VERB 23, PROPN 1), Pla (PROPN 150, NOUN 2), cultura (NOUN 71, PROPN 4), Santa (PROPN 98, NOUN 1), Medi (PROPN 95, NOUN 1), ambient (NOUN 37, ADJ 3, PROPN 2)
- Catalunya
- Govern
- PROPN 442: El Govern frenarà la promesa reducció de tarifes telefòniques .
- NOUN 1: La moció ha estat aprovada per unanimitat , després d’ una esmena de el Partit Popular que feia referència a el passatge ‘ Demanar a el Govern Central de l’ Estat espanyol que no posi impediments perquè el català sigui reconegut com a llengua oficial ‘ .
- sant
- Ajuntament
- estat
- AUX 542: Els més importants han estat de dramatúrgia i de ritme .
- NOUN 103: L’ equip de Trifón Poch va tornar a fer evident el seu estat de gràcia .
- VERB 23: El director no ha estat a la presentació .
- PROPN 1: En relació amb aquest estudi , aquest matí s’ ha defensat , en el marc de la UdG , el treball de recerca de el Programa de Doctorat en Medi Ambient : “ Anàlisi de la qualitat de l’ aigua i el sediment de els recs i rieres de Banyoles per a determinar -ne l’ estat ecològic i la seva utilitat com a corredors biològics “ realitzat per Carles Feo Quer , sota la direcció de el Catedràtic d’ Ecologia Dr. Ramon Moreno-Amich .
- Pla
- cultura
- Santa
- Medi
- PROPN 95: El conseller de Medi Ambient , Felip Puig , va insistir que el projecte “ no està tancat “ .
- NOUN 1: Segons Josep Amat , vicepresident primer de el CILMA . , aquest programa “ té com a objectiu preservar els espais perifèrics d’ aquestes poblacions , que no són urbanitzables , però que també se ‘ls pot treure un rendiment amb la creació de rutes turístiques , i altres activitats compatibles amb el Medi Ambient “ .
- ambient
- NOUN 37: L’ ambient es caldejava .
- ADJ 3: Recentment s’ ha descobert un material que produeix bastant fred a temperatura ambient .
- PROPN 2: La proposició presentada per Joan Boada , diputat-portaveu d’ IC-V , considera que cal donar un ús social i públic a tot l’ espai expropiat - no només a els habitatges - els anys seixanta , evitant ‘ una simple cessió de els habitatges per part de Medi ambient a entitats o institucions ‘ .
Morphology
The form / lemma ratio of PROPN
is 1.000299 (the average of all parts of speech is 1.416814).
The 1st highest number of forms (2) was observed with the lemma “B”: 4B, B.
The 2nd highest number of forms (2) was observed with the lemma “CE”: 2001/37/CE, CE.
The 3rd highest number of forms (2) was observed with the lemma “matar”: matar, maten.
PROPN
occurs with 2 features: Gender (8; 0% instances), Number (8; 0% instances)
PROPN
occurs with 3 feature-value pairs: Gender=Fem
, Gender=Masc
, Number=Sing
PROPN
occurs with 3 feature combinations.
The most frequent feature combination is _
(46582 tokens).
Examples: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
Relations
PROPN
nodes are attached to their parents using 21 different relations: flat (17795; 38% instances), nmod (10774; 23% instances), nsubj (5489; 12% instances), appos (3817; 8% instances), conj (3506; 8% instances), obl (2738; 6% instances), obj (910; 2% instances), obl:arg (897; 2% instances), obl:agent (442; 1% instances), root (146; 0% instances), acl (16; 0% instances), ccomp (14; 0% instances), dep (14; 0% instances), parataxis (11; 0% instances), advcl (7; 0% instances), xcomp (7; 0% instances), acl:relcl (2; 0% instances), nsubj:pass (2; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances), vocative (1; 0% instances)
Parents of PROPN
nodes belong to 15 different parts of speech: PROPN (21430; 46% instances), NOUN (13485; 29% instances), VERB (8993; 19% instances), ADJ (1274; 3% instances), DET (489; 1% instances), NUM (251; 1% instances), ADV (217; 0% instances), (146; 0% instances), PRON (140; 0% instances), AUX (62; 0% instances), ADP (38; 0% instances), SYM (33; 0% instances), CCONJ (17; 0% instances), PART (12; 0% instances), SCONJ (3; 0% instances)
14119 (30%) PROPN
nodes are leaves.
12397 (27%) PROPN
nodes have one child.
10097 (22%) PROPN
nodes have two children.
9977 (21%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 20.
Children of PROPN
nodes are attached using 25 different relations: case (20243; 29% instances), flat (17373; 25% instances), det (12440; 18% instances), punct (8646; 12% instances), conj (3563; 5% instances), cc (2548; 4% instances), nmod (1571; 2% instances), appos (1068; 2% instances), amod (838; 1% instances), acl (718; 1% instances), mark (248; 0% instances), nummod (223; 0% instances), cop (129; 0% instances), advmod (113; 0% instances), nsubj (103; 0% instances), obl (49; 0% instances), aux (21; 0% instances), advcl (12; 0% instances), dep (11; 0% instances), parataxis (8; 0% instances), csubj (4; 0% instances), obj (3; 0% instances), obl:arg (3; 0% instances), acl:relcl (1; 0% instances), ccomp (1; 0% instances)
Children of PROPN
nodes belong to 15 different parts of speech: PROPN (21430; 31% instances), ADP (20161; 29% instances), DET (12459; 18% instances), PUNCT (8646; 12% instances), CCONJ (2471; 4% instances), NOUN (1852; 3% instances), ADJ (986; 1% instances), VERB (691; 1% instances), NUM (404; 1% instances), SCONJ (325; 0% instances), ADV (202; 0% instances), AUX (154; 0% instances), PRON (128; 0% instances), SYM (23; 0% instances), PART (5; 0% instances)