Treebank Statistics: UD_Ukrainian-IU: POS Tags: NUM
There are 318 NUM
lemmas (2%), 376 NUM
types (1%) and 1765 NUM
tokens (1%).
Out of 17 observed tags, the rank of NUM
is: 7 in number of lemmas, 7 in number of types and 13 in number of tokens.
The 10 most frequent NUM
lemmas: два, 1, 2, один, 5, три, 3, 7, 4, 6
The 10 most frequent NUM
types: 1, 2, 5, 3, 7, три, 4, двох, 6, 10
The 10 most frequent ambiguous lemmas: 1 (NUM 100, ADJ 13, NOUN 1), 2 (NUM 88, ADJ 7), один (DET 222, NUM 84, ADJ 8), 5 (NUM 60, ADJ 5, NOUN 1), 3 (NUM 56, ADJ 11), 7 (NUM 48, ADJ 8), 4 (NUM 46, ADJ 5, NOUN 1), 6 (NUM 38, ADJ 2), 10 (NUM 37, ADJ 5), 8 (NUM 34, ADJ 6, NOUN 1)
The 10 most frequent ambiguous types: 1 (NUM 99, ADJ 13, NOUN 1), 2 (NUM 84, ADJ 7), 5 (NUM 59, ADJ 5, NOUN 1), 3 (NUM 55, ADJ 11), 7 (NUM 48, ADJ 8), 4 (NUM 46, ADJ 5, NOUN 1), двох (NUM 38, ADJ 1), 6 (NUM 38, ADJ 2), 10 (NUM 37, ADJ 5), 8 (NUM 34, ADJ 6, NOUN 1)
- 1
- 2
- 5
- NUM 59: 5 .
- ADJ 5: В суботу , 5 серпня Приймальна комісія НаУКМА працюватиме до 18 - 00 !
- NOUN 1: Сьогодні , в суботу , директор хотів , щоб замість того пропущеного часу учились по обіді тепер ( тут тричі на тиждень учаться ще й по обіді від 4 до 5 , одну годину , а ранішня наука іде 3½ год . , від 8½ до 12 ) , але учитель італьянської мови сказав , що нехай директор « ловить » , коли хоче , математика , а він ( італ . ) на урок не прийде , бо й сам хоче в суботу гуляти .
- 3
- 7
- 4
- NUM 46: 4 .
- ADJ 5: 4 лютого почалася битва за Манілу .
- NOUN 1: Сьогодні , в суботу , директор хотів , щоб замість того пропущеного часу учились по обіді тепер ( тут тричі на тиждень учаться ще й по обіді від 4 до 5 , одну годину , а ранішня наука іде 3½ год . , від 8½ до 12 ) , але учитель італьянської мови сказав , що нехай директор « ловить » , коли хоче , математика , а він ( італ . ) на урок не прийде , бо й сам хоче в суботу гуляти .
- двох
- NUM 38: Вона визначила собою коло двох десятиріч нашої духовости .
- ADJ 1: Плоди миють у холодній воді , відділяють домішки , витримують у двох відсотковому розчині солі , щоб позбутися личинок малинового жука , і використовують для варення , консервування з цукром , приготування сиропів , соків , желе .
- 6
- 10
- 8
- NUM 34: У 2015-му продали 400 електрокарів і це становило 0 , 8 % .
- ADJ 6: 8 лютого 1965-го парламент Великої Британії заборонив рекламу сигарет на телебаченні .
- NOUN 1: Крім того , 20 - 23 лютого , у зв’язку з відлигою й сніготаненням , на річках басейнів Сяну , Дністра ( Львівська , Івано-Франківська області ) , Західного Бугу ( Львівська , Волинська області ) очікується підйом рівнів води на 0 , 5 - 1 , 5 м над рівнями , які були 8 ранку 17 лютого .
Morphology
The form / lemma ratio of NUM
is 1.182390 (the average of all parts of speech is 1.738999).
The 1st highest number of forms (11) was observed with the lemma “один”: Одно, один, одна, одне, одним, одного, одному, одної, одну, одній, однієї.
The 2nd highest number of forms (5) was observed with the lemma “мільйон”: мільйон, мільйона, мільйонах, мільйони, мільйонів.
The 3rd highest number of forms (4) was observed with the lemma “два”: два, двома, двох, дві.
NUM
occurs with 8 features: Case (1765; 100% instances), NumType (1765; 100% instances), Uninflect (1232; 70% instances), Gender (406; 23% instances), Number (114; 6% instances), Abbr (62; 4% instances), Orth (24; 1% instances), Animacy (14; 1% instances)
NUM
occurs with 16 feature-value pairs: Abbr=Yes
, Animacy=Anim
, Animacy=Inan
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Gender=Fem
, Gender=Masc
, Gender=Neut
, NumType=Card
, Number=Plur
, Orth=Alt
, Uninflect=Yes
NUM
occurs with 56 feature combinations.
The most frequent feature combination is Case=Nom|NumType=Card|Uninflect=Yes
(468 tokens).
Examples: 3, 7, 5, 4, 6, 8, 10, 00, 15, 2017
Relations
NUM
nodes are attached to their parents using 22 different relations: nummod:gov (521; 30% instances), nummod (509; 29% instances), compound (216; 12% instances), flat:title (190; 11% instances), root (97; 5% instances), flat:range (56; 3% instances), conj (43; 2% instances), nsubj (20; 1% instances), obl (20; 1% instances), flat (18; 1% instances), obj (17; 1% instances), nmod (16; 1% instances), parataxis (13; 1% instances), appos (7; 0% instances), list (7; 0% instances), discourse (4; 0% instances), orphan (4; 0% instances), advcl:pred (2; 0% instances), flat:abs (2; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances), fixed (1; 0% instances)
Parents of NUM
nodes belong to 9 different parts of speech: NOUN (1106; 63% instances), NUM (396; 22% instances), (97; 5% instances), VERB (61; 3% instances), PROPN (39; 2% instances), ADJ (34; 2% instances), X (25; 1% instances), PRON (4; 0% instances), DET (3; 0% instances)
881 (50%) NUM
nodes are leaves.
717 (41%) NUM
nodes have one child.
118 (7%) NUM
nodes have two children.
49 (3%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 11.
Children of NUM
nodes are attached using 28 different relations: punct (511; 45% instances), compound (202; 18% instances), case (74; 7% instances), nummod:gov (57; 5% instances), flat:range (53; 5% instances), conj (49; 4% instances), advmod (39; 3% instances), nummod (35; 3% instances), nmod (26; 2% instances), discourse (24; 2% instances), cc (16; 1% instances), flat (15; 1% instances), appos (6; 1% instances), cop (3; 0% instances), det (3; 0% instances), nsubj (3; 0% instances), obj (3; 0% instances), orphan (3; 0% instances), acl:relcl (2; 0% instances), csubj (2; 0% instances), flat:abs (2; 0% instances), parataxis (2; 0% instances), amod (1; 0% instances), det:numgov (1; 0% instances), expl (1; 0% instances), flat:title (1; 0% instances), list (1; 0% instances), mark (1; 0% instances)
Children of NUM
nodes belong to 16 different parts of speech: PUNCT (511; 45% instances), NUM (396; 35% instances), ADP (74; 7% instances), ADV (38; 3% instances), NOUN (32; 3% instances), PART (25; 2% instances), CCONJ (16; 1% instances), PROPN (9; 1% instances), DET (8; 1% instances), SYM (7; 1% instances), VERB (7; 1% instances), PRON (5; 0% instances), AUX (3; 0% instances), ADJ (2; 0% instances), SCONJ (2; 0% instances), X (1; 0% instances)