Treebank Statistics: UD_Russian-PUD: POS Tags: NOUN
There are 1903 NOUN
lemmas (37%), 3003 NOUN
types (39%) and 4897 NOUN
tokens (25%).
Out of 17 observed tags, the rank of NOUN
is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: год, время, человек, город, компания, место, война, часть, фильм, век
The 10 most frequent NOUN
types: году, года, время, лет, войны, людей, города, компании, результате, течение
The 10 most frequent ambiguous lemmas: правило (NOUN 7, VERB 1), рабочий (ADJ 7, NOUN 3), военный (ADJ 8, NOUN 1), данный (ADJ 4, NOUN 1), знакомый (ADJ 1, NOUN 1), легкий (ADJ 1, NOUN 1), неизвестный (ADJ 2, NOUN 1), сегодня (ADV 5, NOUN 1), целый (ADJ 1, NOUN 1)
The 10 most frequent ambiguous types: многие (ADJ 6, NOUN 3), начала (VERB 5, NOUN 3), имени (NOUN 2, ADP 1), рабочих (ADJ 2, NOUN 2), военные (ADJ 1, NOUN 1), главным (ADJ 4, NOUN 1), правил (VERB 2, NOUN 1), правом (ADJ 1, NOUN 1), прошлого (ADJ 1, NOUN 1), сегодня (ADV 1, NOUN 1)
- многие
- начала
- имени
- рабочих
- военные
- главным
- правил
- VERB 2: Он правил всего пятнадцать лет , о чем свидетельствует множество недостроенных объектов .
- NOUN 1: Судья в процессе по делу Даффи о мошенничестве и злоупотреблении доверием в конечном счете принял решение , что таковые имели место в пределах правил Сената , сняв при этом с Даффи все обвинения .
- правом
- прошлого
- ADJ 1: Последние цифры относятся к 24 октября прошлого года и говорят нам , что наше дизельное топливо стоит 1335 евро за литр по сравнению со средней по еврозоне стоимостью , составляющей 1165 евро .
- NOUN 1: Но в отступлении от риторики прошлого о сокращении иммиграции кандидат Республиканской партии заявил , что в качестве президента он позволил бы въезд « огромного количества » легальных мигрантов на основе « системы заслуг » .
- сегодня
- ADV 1: « Если передача цифровых технологий сегодня в США происходит впервые , то о мирной передаче власти такого не скажешь » , – написала Кори Шульман , специальный помощник президента Обамы в своем блоге в понедельник .
- NOUN 1: Это здорово , что они подписали Парижские соглашения , но их вклады на сегодня очень далеки от обеспечения целевых показателей в 1,5 градуса .
Morphology
The form / lemma ratio of NOUN
is 1.578035 (the average of all parts of speech is 1.496727).
The 1st highest number of forms (12) was observed with the lemma “год”: Годом, г., гг, гг., год, года, годами, годах, годов, году, годы, лет.
The 2nd highest number of forms (9) was observed with the lemma “фильм”: Фильмы, фильм, фильма, фильмам, фильмах, фильме, фильмов, фильмом, фильму.
The 3rd highest number of forms (8) was observed with the lemma “город”: г., город, города, городами, городах, городе, городов, городом.
NOUN
occurs with 6 features: Animacy (4892; 100% instances), Case (4892; 100% instances), Gender (4892; 100% instances), Number (4892; 100% instances), Abbr (43; 1% instances), Foreign (5; 0% instances)
NOUN
occurs with 15 feature-value pairs: Abbr=Yes
, Animacy=Anim
, Animacy=Inan
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Number=Plur
, Number=Sing
NOUN
occurs with 77 feature combinations.
The most frequent feature combination is Animacy=Inan|Case=Gen|Gender=Fem|Number=Sing
(388 tokens).
Examples: войны, компании, жизни, партии, страны, власти, полиции, среды, стороны, воды
Relations
NOUN
nodes are attached to their parents using 25 different relations: nmod (1491; 30% instances), obl (1164; 24% instances), nsubj (700; 14% instances), obj (599; 12% instances), conj (278; 6% instances), nsubj:pass (124; 3% instances), fixed (110; 2% instances), iobj (110; 2% instances), xcomp (85; 2% instances), appos (64; 1% instances), root (57; 1% instances), parataxis (44; 1% instances), nummod (16; 0% instances), orphan (11; 0% instances), obl:agent (10; 0% instances), advcl (7; 0% instances), ccomp (7; 0% instances), compound (7; 0% instances), acl (3; 0% instances), nummod:gov (3; 0% instances), flat:foreign (2; 0% instances), vocative (2; 0% instances), acl:relcl (1; 0% instances), amod (1; 0% instances), flat:name (1; 0% instances)
Parents of NOUN
nodes belong to 13 different parts of speech: VERB (2599; 53% instances), NOUN (1792; 37% instances), ADJ (126; 3% instances), ADP (107; 2% instances), PROPN (61; 1% instances), (57; 1% instances), AUX (51; 1% instances), NUM (35; 1% instances), ADV (31; 1% instances), DET (13; 0% instances), PRON (13; 0% instances), SYM (11; 0% instances), X (1; 0% instances)
802 (16%) NOUN
nodes are leaves.
1743 (36%) NOUN
nodes have one child.
1511 (31%) NOUN
nodes have two children.
841 (17%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 9.
Children of NOUN
nodes are attached using 33 different relations: nmod (1830; 24% instances), amod (1680; 22% instances), case (1661; 21% instances), punct (507; 7% instances), det (464; 6% instances), conj (266; 3% instances), cc (215; 3% instances), acl (209; 3% instances), nummod (158; 2% instances), acl:relcl (132; 2% instances), flat:name (104; 1% instances), advmod (93; 1% instances), appos (75; 1% instances), nummod:gov (69; 1% instances), nsubj (68; 1% instances), flat (51; 1% instances), cop (40; 1% instances), parataxis (31; 0% instances), mark (15; 0% instances), xcomp (14; 0% instances), obl (11; 0% instances), advcl (10; 0% instances), orphan (10; 0% instances), compound (7; 0% instances), iobj (7; 0% instances), expl (5; 0% instances), fixed (5; 0% instances), discourse (2; 0% instances), flat:foreign (2; 0% instances), aux (1; 0% instances), ccomp (1; 0% instances), csubj (1; 0% instances), nummod:entity (1; 0% instances)
Children of NOUN
nodes belong to 16 different parts of speech: NOUN (1792; 23% instances), ADJ (1712; 22% instances), ADP (1610; 21% instances), PROPN (542; 7% instances), PUNCT (507; 7% instances), DET (465; 6% instances), VERB (373; 5% instances), NUM (213; 3% instances), CCONJ (212; 3% instances), ADV (68; 1% instances), SCONJ (65; 1% instances), PRON (60; 1% instances), PART (50; 1% instances), AUX (41; 1% instances), X (28; 0% instances), SYM (7; 0% instances)