home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Finnish-TDT: POS Tags: VERB

There are 2480 VERB lemmas (9%), 10699 VERB types (19%) and 27342 VERB tokens (14%). Out of 15 observed tags, the rank of VERB is: 4 in number of lemmas, 2 in number of types and 3 in number of tokens.

The 10 most frequent VERB lemmas: saada, tehdä, olla, tulla, antaa, ottaa, sanoa, haluta, käyttää, koskea

The 10 most frequent VERB types: ottaa, tulee, saa, sai, tuli, on, tehdä, sanoi, antaa, pitää

The 10 most frequent ambiguous lemmas: olla (AUX 8203, VERB 645), pitää (VERB 271, AUX 212), päästä (VERB 168, ADP 14), tarvita (VERB 120, AUX 33), ei (AUX 2383, VERB 87, ADV 23), joutua (VERB 63, AUX 61), saavuttaa (VERB 54, NOUN 1), kehittää (VERB 52, NOUN 1), saattaa (AUX 101, VERB 17), tunnustaa (VERB 16, NOUN 1)

The 10 most frequent ambiguous types: on (AUX 3844, VERB 86, PROPN 4, ADV 1), pitää (VERB 76, AUX 57), olevan (AUX 70, VERB 57, NOUN 1), ei (AUX 1431, VERB 38, ADV 7, ADJ 1), toimi (VERB 42, NOUN 1), olemassa (VERB 40, AUX 2), oli (AUX 1173, VERB 28), oleva (VERB 35, NOUN 1), sanoa (VERB 35, ADV 1), olla (AUX 286, VERB 34)

Morphology

The form / lemma ratio of VERB is 4.314113 (the average of all parts of speech is 2.067974).

The 1st highest number of forms (88) was observed with the lemma “tehdä”: Teinpä, Tekeekö, Tekivätkö, tee, teemme, teen, teenkin, teenkö, teet, tehden, tehdessä, tehdessään, tehdyillä, tehdyissä, tehdyistä, tehdylle, tehdyllä, tehdyn, tehdyssä, tehdystä, tehdyt, tehdä, tehdään, tehköön, tehneen, tehneensä, tehneet, tehneille, tehny, tehnyt, tehnytkin, tehtiin, tehtiinkin, tehty, tehtyjen, tehtyjä, tehtynä, tehtyyn, tehtyä, tehtyäni, tehtyään, tehtäessä, tehtävien, tehtäviin, tehtäville, tehtävistä, tehtäviä, tehtävä, tehtävän, teimme, tein, teinkin, teit, tekee, tekeekin, tekemiensä, tekemiin, tekemiä, tekemiäni, tekemiään, tekemä, tekemällä, tekemän, tekemäni, tekemänsä, tekemässä, tekemästä, tekemästään, tekemät, tekemättä, tekemää, tekemään, tekemäänsä, tekevien, tekeville, tekevä, tekeväni, tekevät, tekevää, tekevään, teki, tekikin, tekis, tekisi, tekisimme, tekisin, tekisivät, tekivät.

The 2nd highest number of forms (82) was observed with the lemma “saada”: Saamiemme, Saamillaan, Saisitte, saa, saada, saadaan, saadaankin, saadaanko, saadakseen, saadakseni, saadaksesi, saadessa, saaduista, saadulle, saadut, saahan, saako, saama, saamaan, saamaani, saamaankaan, saamaansa, saaman, saamani, saamansa, saamassa, saamasta, saamat, saamatta, saamien, saamienne, saamiini, saamiinsa, saamme, saan, saanee, saaneen, saaneensa, saaneet, saaneiden, saaneita, saanen, saannut, saanu, saanut, saanutta, saat, saataisiin, saatava, saatavalla, saatavana, saatavat, saatavilla, saataville, saatavissa, saatavista, saatiin, saatte, saatu, saatuaan, saatuani, saatuja, saatujen, saava, saavan, saavani, saavansa, saavat, saavien, sai, saikin, saimme, sain, sais, saisi, saisimme, saisin, saisit, saisivat, sait, saivat, sanut.

The 3rd highest number of forms (72) was observed with the lemma “olla”: Olisiko, Olisikohan, Onpa, Onpas, Oon, lienee, oelmassa, ole, olemaan, olemassa, olemasta, olemme, olemmekin, olen, olenkin, olet, olette, oleva, olevaa, olevaan, olevalla, olevalle, olevan, olevana, olevansa, olevasi, olevassa, olevasta, olevat, olevia, olevien, oleviksi, olevilla, oleville, olevilta, olevissa, olevista, oli, olihan, olikaan, olin, olipas, olis, olisi, olisivat, olivat, olkoon, olkoot, olla, ollaan, olleelle, olleen, olleessa, olleet, olleiden, olleista, olleita, ollessa, ollu, ollut, ollutkaan, ollutta, oltaessa, oltava, oltiin, on, onki, onko, onks, oo, ootte, ovat.

VERB occurs with 18 features: VerbForm (27342; 100% instances), Voice (26444; 97% instances), Number (24233; 89% instances), Mood (14634; 54% instances), Tense (13556; 50% instances), Person (11684; 43% instances), Case (9466; 35% instances), PartForm (7276; 27% instances), InfForm (5341; 20% instances), Connegative (1023; 4% instances), Person[psor] (517; 2% instances), Clitic (406; 1% instances), Style (353; 1% instances), Number[psor] (159; 1% instances), Polarity (91; 0% instances), Typo (89; 0% instances), Abbr (47; 0% instances), Derivation (2; 0% instances)

VERB occurs with 60 feature-value pairs: Abbr=Yes, Case=Abe, Case=Abl, Case=Ade, Case=All, Case=Ela, Case=Ess, Case=Gen, Case=Ill, Case=Ine, Case=Ins, Case=Nom, Case=Par, Case=Tra, Clitic=Han, Clitic=Han,Ko, Clitic=Han,Pa, Clitic=Ka, Clitic=Kaan, Clitic=Kin, Clitic=Ko, Clitic=Ko,S, Clitic=Pa, Clitic=Pa,S, Clitic=S, Connegative=Yes, Derivation=Ton, InfForm=1, InfForm=2, InfForm=3, Mood=Cnd, Mood=Imp, Mood=Ind, Mood=Pot, Number=Plur, Number=Sing, Number[psor]=Plur, Number[psor]=Sing, PartForm=Agt, PartForm=Neg, PartForm=Past, PartForm=Pres, Person=0, Person=1, Person=2, Person=3, Person[psor]=1, Person[psor]=2, Person[psor]=3, Polarity=Neg, Style=Arch, Style=Coll, Tense=Past, Tense=Pres, Typo=Yes, VerbForm=Fin, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Pass

VERB occurs with 441 feature combinations. The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin|Voice=Act (3342 tokens). Examples: sai, tuli, sanoi, kertoi, alkoi, voitti, teki, nousi, toimi, jäi

Relations

VERB nodes are attached to their parents using 25 different relations: root (10444; 38% instances), conj (3722; 14% instances), acl (3630; 13% instances), advcl (2721; 10% instances), xcomp (1758; 6% instances), acl:relcl (1690; 6% instances), ccomp (1446; 5% instances), xcomp:ds (848; 3% instances), parataxis (673; 2% instances), csubj:cop (184; 1% instances), csubj (46; 0% instances), nsubj (35; 0% instances), appos (29; 0% instances), obl (21; 0% instances), nsubj:cop (18; 0% instances), nmod:poss (16; 0% instances), compound:nn (15; 0% instances), obj (15; 0% instances), orphan (11; 0% instances), nmod (10; 0% instances), fixed (4; 0% instances), discourse (3; 0% instances), advmod (1; 0% instances), nmod:gobj (1; 0% instances), nmod:gsubj (1; 0% instances)

Parents of VERB nodes belong to 13 different parts of speech: (10444; 38% instances), VERB (9079; 33% instances), NOUN (5725; 21% instances), ADJ (924; 3% instances), PRON (557; 2% instances), PROPN (332; 1% instances), ADV (242; 1% instances), NUM (10; 0% instances), SYM (9; 0% instances), INTJ (7; 0% instances), X (7; 0% instances), AUX (5; 0% instances), ADP (1; 0% instances)

1034 (4%) VERB nodes are leaves.

4751 (17%) VERB nodes have one child.

3777 (14%) VERB nodes have two children.

17780 (65%) VERB nodes have three or more children.

The highest child degree of a VERB node is 12.

Children of VERB nodes are attached using 41 different relations: punct (17788; 20% instances), obl (17184; 19% instances), nsubj (11660; 13% instances), obj (11292; 13% instances), advmod (7466; 8% instances), aux (4878; 5% instances), conj (3669; 4% instances), cc (3002; 3% instances), mark (2842; 3% instances), advcl (2415; 3% instances), xcomp (2297; 3% instances), ccomp (1304; 1% instances), xcomp:ds (819; 1% instances), aux:pass (758; 1% instances), parataxis (446; 1% instances), compound:prt (267; 0% instances), discourse (167; 0% instances), acl:relcl (162; 0% instances), cop (153; 0% instances), nsubj:cop (127; 0% instances), vocative (85; 0% instances), csubj (50; 0% instances), acl (21; 0% instances), cc:preconj (21; 0% instances), det (19; 0% instances), nsubj:outer (18; 0% instances), amod (17; 0% instances), appos (17; 0% instances), case (5; 0% instances), csubj:cop (5; 0% instances), dislocated (5; 0% instances), nmod:poss (5; 0% instances), dep (4; 0% instances), nmod (4; 0% instances), cop:own (2; 0% instances), fixed (2; 0% instances), nmod:gsubj (2; 0% instances), orphan (2; 0% instances), goeswith (1; 0% instances), nmod:gobj (1; 0% instances), nummod (1; 0% instances)

Children of VERB nodes belong to 15 different parts of speech: NOUN (29566; 33% instances), PUNCT (17788; 20% instances), VERB (9079; 10% instances), ADV (8005; 9% instances), PRON (6940; 8% instances), AUX (5797; 7% instances), PROPN (3597; 4% instances), CCONJ (3022; 3% instances), SCONJ (2795; 3% instances), ADJ (1562; 2% instances), NUM (569; 1% instances), SYM (150; 0% instances), INTJ (85; 0% instances), X (20; 0% instances), ADP (8; 0% instances)