Treebank Statistics: UD_Uyghur-UDT: POS Tags: AUX
There are 7 AUX
lemmas (0%), 165 AUX
types (1%) and 911 AUX
tokens (2%).
Out of 16 observed tags, the rank of AUX
is: 13 in number of lemmas, 5 in number of types and 8 in number of tokens.
The 10 most frequent AUX
lemmas: بول، _، ئى، كەت، قال، تۇر، كەل
The 10 most frequent AUX
types: ئىدى، بولۇپ، ئىكەن، كەتتى، قالدى، بولسا، بولدى، ئەمەس، بولىدۇ، قالدىم
The 10 most frequent ambiguous lemmas: بول (VERB 314, AUX 275), _ (VERB 4560, NOUN 4224, PRON 479, PUNCT 434, ADJ 326, AUX 185, ADV 157, PART 119, NUM 75, CCONJ 72, ADP 51, INTJ 47, DET 28, X 27), كەت (AUX 100, VERB 74), قال (AUX 89, VERB 55), تۇر (VERB 111, AUX 50), كەل (VERB 175, AUX 27)
The 10 most frequent ambiguous types: ئىدى (AUX 126, VERB 2), بولۇپ (VERB 95, AUX 71), ئىكەن (AUX 64, VERB 3), كەتتى (AUX 61, VERB 13), قالدى (AUX 42, VERB 8), بولسا (AUX 40, VERB 16), بولدى (AUX 31, VERB 27), ئەمەس (AUX 30, ADV 10), بولىدۇ (AUX 27, VERB 16), قالدىم (AUX 19, VERB 3)
- ئىدى
- بولۇپ
- ئىكەن
- كەتتى
- قالدى
- بولسا
- بولدى
- ئەمەس
- بولىدۇ
- قالدىم
Morphology
The form / lemma ratio of AUX
is 23.571429 (the average of all parts of speech is 4.088599).
The 1st highest number of forms (73) was observed with the lemma “_”: ئوخشايدۇ, ئوخشايمىز, ئىدىغۇ, ئىدىكىن, ئىشلاتمىسەك, ئىكەن, ئىكەنسىز, ئىكەنغۇ, ئىكەنلىكى, ئىكەنلىكىمنى, ئىكەنلىكىنى, ئۆزگىرىشلەر, ئەمەسكەن, ئەمەسلىكىنى, باقماقچى, باقماپتىكەنمەن, بولاتتى, بولاتتىم, بولالايدۇ, بولالمايدۇ, بولاي, بولسىلا, بولغاندىكىن, بولغاندەك, بولغانلىقى, بولغانلىقىنى, بولغانىدى, بولغانىكەن, بولغاچقا, بولغىنىم, بولغۇچىنىڭ, بولماس, بولماي, بولمىغانلىقتىن, بولمىغاچقا, بولىدى, بولىدىغان, بولىدىغۇ, بولىدىكەن, بولىشىمۇ, بولۇشقاندۇ, بولۇشۇپ, بولۇشۇپتۇ, بولۇپلا, بولۇڭ, بولۇڭلار, بولۇۋاتقان, بوپتىكەن, بوپتۇ, تۇراتتى, تۇرغۇدەك, تۇرۇپتۇ, دېگەنىدى, قارىغۇدەك, قالماي, قاپتۇ, قويغۇممۇ, قويۇپ, قىلىۋېتىدىغان, كۆرمىگەن, كېتىشلىرىمىزمۇ, كېتەتتى, كېلىدىكەن, كېلەتتى, كەتكەچكە, ىكەن, يۈرۈپتۇ, يېتەلىشى, يېگۈدەك, چىقماقچى, چىقماپتۇ, چىقمىدىغۇ, ھېساپلىنىدۇ.
The 2nd highest number of forms (37) was observed with the lemma “بول”: بولاتتى, بولاتتىكى, بولدى, بولدىڭىز, بولدۇم, بولدۇڭ, بولسا, بولساق, بولساقمۇ, بولسام, بولساممۇ, بولسامچۇ, بولساڭ, بولساڭمۇ, بولسىمۇ, بولسىڭىز, بولسۇن, بولغان, بولغاندا, بولغاندىن, بولغىنى, بولمامدۇ, بولمايدىكەن, بولمايدۇ, بولمىسا, بولمىسىمۇ, بولمىغان, بولىدۇ, بولىسىز, بولىسەن, بولىمىز, بولىمەن, بولۇش, بولۇشى, بولۇشىدىن, بولۇشىنى, بولۇپ.
The 3rd highest number of forms (15) was observed with the lemma “قال”: قالدى, قالدىم, قالدىڭ, قالدىڭىز, قالدۇق, قالسا, قالسام, قالغان, قالغاندا, قالغىنى, قالمايدۇ, قالمىدۇق, قېلىشى, قېلىشىدىن, قېلىپ.
AUX
occurs with 11 features: VerbForm (682; 75% instances), Number (592; 65% instances), Person (592; 65% instances), Mood (559; 61% instances), Tense (469; 51% instances), Aspect (171; 19% instances), Polarity (58; 6% instances), Case (25; 3% instances), Number[psor] (11; 1% instances), Person[psor] (11; 1% instances), Polite (3; 0% instances)
AUX
occurs with 26 feature-value pairs: Aspect=Hab
, Aspect=Perf
, Case=Abl
, Case=Acc
, Case=Dat
, Case=Loc
, Case=Nom
, Mood=Cnd
, Mood=Imp
, Mood=Ind
, Number=Plur
, Number=Sing
, Number[psor]=Plur,Sing
, Person=1
, Person=2
, Person=3
, Person[psor]=3
, Polarity=Neg
, Polite=Form
, Tense=Past
, Tense=Pres
, VerbForm=Conv
, VerbForm=Fin
, VerbForm=Ger
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 36 feature combinations.
The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin
(305 tokens).
Examples: ئىدى، كەتتى، قالدى، بولدى، بولغان، كەلدى، كەتكەن، تۇردى، قالغان، تۇرغان
Relations
AUX
nodes are attached to their parents using 11 different relations: cop (555; 61% instances), aux (337; 37% instances), root (6; 1% instances), discourse (3; 0% instances), acl (2; 0% instances), nsubj (2; 0% instances), parataxis (2; 0% instances), advcl (1; 0% instances), amod (1; 0% instances), compound (1; 0% instances), conj (1; 0% instances)
Parents of AUX
nodes belong to 10 different parts of speech: VERB (471; 52% instances), NOUN (254; 28% instances), ADJ (141; 15% instances), PRON (18; 2% instances), NUM (8; 1% instances), ADV (7; 1% instances), (6; 1% instances), AUX (4; 0% instances), ADP (1; 0% instances), X (1; 0% instances)
632 (69%) AUX
nodes are leaves.
262 (29%) AUX
nodes have one child.
8 (1%) AUX
nodes have two children.
9 (1%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 7.
Children of AUX
nodes are attached using 14 different relations: punct (275; 87% instances), obl (10; 3% instances), compound:lvc (6; 2% instances), compound (5; 2% instances), nsubj (5; 2% instances), advcl (4; 1% instances), cop (4; 1% instances), obj (2; 1% instances), amod (1; 0% instances), cc (1; 0% instances), conj (1; 0% instances), dep (1; 0% instances), nummod (1; 0% instances), xcomp (1; 0% instances)
Children of AUX
nodes belong to 9 different parts of speech: PUNCT (275; 87% instances), NOUN (14; 4% instances), VERB (14; 4% instances), AUX (4; 1% instances), NUM (3; 1% instances), ADJ (2; 1% instances), ADV (2; 1% instances), PRON (2; 1% instances), CCONJ (1; 0% instances)