Treebank Statistics: UD_Lithuanian-HSE: POS Tags: CCONJ
There are 17 CCONJ
lemmas (1%), 15 CCONJ
types (1%) and 311 CCONJ
tokens (6%).
Out of 16 observed tags, the rank of CCONJ
is: 11 in number of lemmas, 13 in number of types and 7 in number of tokens.
The 10 most frequent CCONJ
lemmas: ir, bet, o, ar, bei, arba, nei, ne, tačiau, taigi
The 10 most frequent CCONJ
types: ir, bet, o, ar, bei, arba, nei, ne, tačiau, taigi
The 10 most frequent ambiguous lemmas: ir (CCONJ 162, PART 32), ar (CCONJ 15, PART 2), ne (PART 38, CCONJ 5), taigi (CCONJ 4, PART 3), čia (CCONJ 2, ADV 1), kiek (ADV 4, CCONJ 1, PART 1), kuo (ADV 1, CCONJ 1), ne%tik (CCONJ 1, PART 1), taip (PART 10, ADV 6, CCONJ 1), vis%dėlto (CCONJ 1, SCONJ 1)
The 10 most frequent ambiguous types: ir (CCONJ 160, PART 32), ar (CCONJ 15, PART 2), ne (PART 36, CCONJ 6), taigi (CCONJ 4, PART 3), čia (ADV 1, CCONJ 1), kiek (ADV 4, CCONJ 1), kuo (PRON 2, ADV 1, CCONJ 1), taip (PART 7, ADV 5, CCONJ 1)
- ir
- ar
- ne
- taigi
- čia
- kiek
- kuo
- PRON 2: Šiose srityse , deja , dar maža kuo galime didžiuotis .
- ADV 1: Esu skaitęs – tiesa , ne lietuvių spaudoje , - interviu su mergina iš Europos , kuri atsako į klausimą , kuo skiriasi Rytų Europos politinė scena nuo Vakarų politinės scenos .
- CCONJ 1: Tapatinti ją su TSRS yra piktybiška demagogija – šiaip ar taip , kiekvienas lietuvis žino , kuo skiriasi Kolyma nuo Dublino ar Londono .
- taip
- PART 7: Deja , taip nėra – šiandien jie pastebimai aštrėja .
- ADV 5: Autorius aiškiai yra Strepsiado pusėje – taip Sokratui ir reikia .
- CCONJ 1: Tikras lietuvis yra tik tas , kuris nemėgsta , o dar geriau nekenčia rusų , lenkų , žydų , taip pat ir vakariečių , mėgsta nebent palestiniečius ( beje , nesunku įsivaizduoti , ką mūsų patriotai pradėtų sakyti apie palestiniečius , jeigu su jais susidurtų kasdienybėje , kaip susidūrė su čečėnais ) .
Morphology
The form / lemma ratio of CCONJ
is 0.882353 (the average of all parts of speech is 1.442977).
The 1st highest number of forms (2) was observed with the lemma “bet%ir”: bet, ir.
The 2nd highest number of forms (1) was observed with the lemma “ar”: ar.
The 3rd highest number of forms (1) was observed with the lemma “arba”: arba.
CCONJ
occurs with 2 features: Polarity (8; 3% instances), Degree (1; 0% instances)
CCONJ
occurs with 2 feature-value pairs: Degree=Pos
, Polarity=Neg
CCONJ
occurs with 3 feature combinations.
The most frequent feature combination is _
(302 tokens).
Examples: ir, bet, o, ar, bei, arba, nei, tačiau, taigi, čia
Relations
CCONJ
nodes are attached to their parents using 4 different relations: cc (287; 92% instances), fixed (16; 5% instances), advmod (4; 1% instances), case (4; 1% instances)
Parents of CCONJ
nodes belong to 10 different parts of speech: NOUN (110; 35% instances), VERB (101; 32% instances), ADJ (46; 15% instances), PROPN (22; 7% instances), ADV (13; 4% instances), SCONJ (10; 3% instances), CCONJ (4; 1% instances), DET (2; 1% instances), PRON (2; 1% instances), PART (1; 0% instances)
293 (94%) CCONJ
nodes are leaves.
17 (5%) CCONJ
nodes have one child.
1 (0%) CCONJ
nodes have two children.
The highest child degree of a CCONJ
node is 2.
Children of CCONJ
nodes are attached using 2 different relations: fixed (12; 63% instances), punct (7; 37% instances)
Children of CCONJ
nodes belong to 4 different parts of speech: PUNCT (7; 37% instances), ADV (5; 26% instances), CCONJ (4; 21% instances), PART (3; 16% instances)