Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_French-GSD: POS Tags: `NUM`

There are 1849 NUM lemmas (5%), 1850 NUM types (4%) and 10522 NUM tokens (3%). Out of 16 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 11 in number of tokens.

The 10 most frequent NUM lemmas: deux, trois, 2, 3, 5, quatre, 2010, un, 4, 20

The 10 most frequent NUM types: deux, trois, 2, 3, 5, quatre, 2010, 4, 20, 2009

The 10 most frequent ambiguous lemmas: un (DET 10063, PRON 319, NUM 122, X 1), 4 (NUM 120, PROPN 2, X 1), 7 (NUM 104, X 1), II (NUM 78, PROPN 5), cinq (NUM 77, NOUN 3), 1er (NUM 44, ADJ 18), h (NOUN 40, NUM 35), 50 (NUM 39, X 1), I (NUM 29, PROPN 9, X 1), cent (NUM 20, NOUN 1)

The 10 most frequent ambiguous types: 4 (NUM 120, PROPN 2, X 1), 7 (NUM 104, X 1), II (NUM 78, PROPN 5), cinq (NUM 68, NOUN 3), une (DET 3373, PRON 114, NUM 58, NOUN 1), un (DET 3929, PRON 182, NUM 58, X 1), 1er (NUM 44, ADJ 16), h (NOUN 40, NUM 35), 50 (NUM 39, X 1), I (NUM 29, PROPN 9, X 1)

4
- NUM 120: Côte de Bellevue Catégorie 4 ( 109,5 km )
- PROPN 2: ” C’ est la panique totale sur le marché , et la chute de le cours suit le risque souverain “ , explique Nuria Alvarez , analyste chez Renta 4 .
- X 1: Le premier single extrait de l’ album , “ 4 Seasons of Loneliness “ , sortit en aout 1997 .
7
- NUM 104: Maxime , 10 ans , est mannequin depuis l’ âge de 7 ans .
- X 1: Le label a sorti plusieurs albums de groupe influent , sinon des groupe “ genre-defining “ , incluent 7 Seconds et SNFU dans les années 1980 et Leatherface , The Unseen , Throw Rag , Pistol Grip , Souls , Youth Brigade / Swinging Utters et Alkaline Trio / One Man Army et d’ autres groupe de nos jours .
II
- NUM 78: Le roi Mutesa II en devient le président à vie .
- PROPN 5: ( Le Monde de la Musique ) , Tango II participe à de nombreuses tournées …
cinq
- NUM 68: Cette exposition se déroule en cinq points .
- NOUN 3: Après un seul match disputé dans le cinq majeur , lors de son premier match , il intègre le premier cinq en mars 1996 .
une
- DET 3373: On en avait vue une dizaine à le premier contrôle mais pas celle là .
- PRON 114: M. Enzo a d’ ailleurs envoyé paître une de mes collègues !
- NUM 58: En une à deux semaines , la feuille a repris sa forme initiale .
- NOUN 1: Il vaut donc mieux éviter l’ expression « la clôture algébrique » et privilégier l’ article indéfini « une » ( une autre façon de le voir est qu’ il n’ existe pas de foncteur de la catégorie de les corps dans elle-même qui envoie tout corps K sur une clôture algébrique de K ) .
un
- DET 3929: Aviator , un film sur la vie de Hughes .
- PRON 182: Il a trois frères , dont l’ un est l’ entomologiste Théodore Lacordaire .
- NUM 58: En 1980 il n’ en reste plus qu’ un seul : St-Auban .
- X 1: C’ est à cette époque que Mère Théodore Guérin ( canonisée en 2006 ) fonde sa première un institution , un orphelinat à Vincennes et que sa congrégation essaime dans le nord de le pays .
1er
- NUM 44: Ils seront inaugurés le 1er septembre 1975 .
- ADJ 16: Ils sont à le nombre de 3 et le 1er prend le nom de maire .
h
- NOUN 40: Nous sommes allés samedi soir ( vers 23 h ) à le HD de Saint Michel .
- NUM 35: La séance commence vers 22 h 00 .
50
- NUM 39: Ce taux atteint même 50 % dans certains centres .
- X 1: Ainsi en 2004 , elle fut à l’ affiche de les films Une famille pour la vie et 50 Ways to Leave Your Lover , en 2005 Passions sous la neige et L’ héritage de la passion et plus récemment le thriller Between , où elle rencontra également l’ amour avec Adam Kaufman , son co-star dans ce film .
I
- NUM 29: Il participe aussi à le Tome I de Quelle Wallonie ?
- PROPN 9: I Carinae ( I Car ) est une étoile de la constellation de la Carène .
- X 1: Elle entame ensuite une carrière solo jusqu’ en 1990 , avec des titres tels que The More I See You ( 1986 ) ou Place de la Madeleine ( 1987 ) .

Morphology

The form / lemma ratio of NUM is 1.000541 (the average of all parts of speech is 1.308785).

The 1st highest number of forms (2) was observed with the lemma “cent”: cent, cents.

The 2nd highest number of forms (2) was observed with the lemma “un”: un, une.

The 3rd highest number of forms (1) was observed with the lemma “’06”: ‘06.

NUM occurs with 4 features: Number (10505; 100% instances), Gender (61; 1% instances), ExtPos (2; 0% instances), Typo (2; 0% instances)

NUM occurs with 5 feature-value pairs: ExtPos=PROPN, Gender=Fem, Number=Plur, Number=Sing, Typo=Yes

NUM occurs with 6 feature combinations. The most frequent feature combination is Number=Plur (9214 tokens). Examples: deux, trois, 2, quatre, 2010, 2009, 2008, 2011, 3, 5

Relations

NUM nodes are attached to their parents using 22 different relations: nummod (3639; 35% instances), nmod (3268; 31% instances), obl:mod (2211; 21% instances), obl:arg (741; 7% instances), conj (375; 4% instances), appos (54; 1% instances), orphan (40; 0% instances), nsubj (32; 0% instances), obj (32; 0% instances), root (24; 0% instances), flat:name (19; 0% instances), parataxis (19; 0% instances), acl:relcl (18; 0% instances), flat (16; 0% instances), nsubj:pass (12; 0% instances), xcomp (11; 0% instances), advcl (3; 0% instances), ccomp (3; 0% instances), obl:agent (2; 0% instances), dep (1; 0% instances), fixed (1; 0% instances), obl (1; 0% instances)

Parents of NUM nodes belong to 14 different parts of speech: NOUN (5778; 55% instances), VERB (2691; 26% instances), NUM (706; 7% instances), PROPN (640; 6% instances), SYM (446; 4% instances), X (66; 1% instances), ADJ (63; 1% instances), ADP (58; 1% instances), PRON (36; 0% instances), (24; 0% instances), ADV (9; 0% instances), INTJ (3; 0% instances), AUX (1; 0% instances), DET (1; 0% instances)

5614 (53%) NUM nodes are leaves.

2404 (23%) NUM nodes have one child.

1742 (17%) NUM nodes have two children.

762 (7%) NUM nodes have three or more children.

The highest child degree of a NUM node is 10.

Children of NUM nodes are attached using 26 different relations: case (2949; 35% instances), punct (1725; 20% instances), nmod (1437; 17% instances), det (1091; 13% instances), conj (380; 4% instances), cc (281; 3% instances), advmod (186; 2% instances), obl:arg (174; 2% instances), amod (57; 1% instances), nummod (43; 1% instances), appos (39; 0% instances), cop (31; 0% instances), nsubj (26; 0% instances), flat (16; 0% instances), acl (15; 0% instances), obl:mod (9; 0% instances), orphan (9; 0% instances), parataxis (9; 0% instances), acl:relcl (6; 0% instances), flat:name (6; 0% instances), mark (6; 0% instances), advcl:cleft (5; 0% instances), expl:subj (5; 0% instances), advcl (3; 0% instances), aux:tense (1; 0% instances), discourse (1; 0% instances)

Children of NUM nodes belong to 16 different parts of speech: ADP (2959; 35% instances), PUNCT (1725; 20% instances), NOUN (1282; 15% instances), DET (1091; 13% instances), NUM (706; 8% instances), CCONJ (256; 3% instances), ADV (173; 2% instances), PROPN (66; 1% instances), ADJ (63; 1% instances), PRON (53; 1% instances), SYM (44; 1% instances), VERB (39; 0% instances), AUX (32; 0% instances), X (16; 0% instances), SCONJ (4; 0% instances), INTJ (1; 0% instances)

Treebank Statistics: UD_French-GSD: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_French-GSD: POS Tags: `NUM`