Treebank Statistics: UD_Icelandic-IcePaHC: POS Tags: ADJ
There are 6061 ADJ
lemmas (16%), 12296 ADJ
types (17%) and 37158 ADJ
tokens (4%).
Out of 16 observed tags, the rank of ADJ
is: 2 in number of lemmas, 3 in number of types and 12 in number of tokens.
The 10 most frequent ADJ
lemmas: góður, samur, stór, heilagur, gamall, sannur, langur, fullur, illur, ungur
The 10 most frequent ADJ
types: sama, gott, góða, satt, góður, sömu, stór, fyrsta, góð, fyrstu
The 10 most frequent ambiguous lemmas: góður (ADJ 1942, ADV 6, NOUN 4), samur (ADJ 720, PRON 6, ADV 2), stór (ADJ 629, ADV 5), heilagur (ADJ 553, PROPN 35, ADV 1), gamall (ADJ 536, PROPN 8, ADV 2), sannur (ADJ 515, NOUN 8, ADV 1), langur (ADJ 373, PROPN 3, ADV 1, DET 1, NOUN 1), fullur (ADJ 367, VERB 1), illur (ADJ 349, ADV 2), lítill (DET 700, ADJ 343, ADV 19, NOUN 1, PRON 1)
The 10 most frequent ambiguous types: sama (ADJ 437, PRON 6, VERB 3, ADV 2), gott (ADJ 283, NOUN 9, ADV 1, X 1), góða (ADJ 199, NOUN 20), satt (ADJ 179, ADV 2), fyrsta (ADJ 135, ADV 3), fyrstu (ADJ 127, NOUN 1), þriðja (ADJ 121, NOUN 1, NUM 1), heilaga (ADJ 130, PROPN 6), sæla (ADJ 120, NOUN 4), næsta (ADJ 100, ADV 40)
- sama
- ADJ 437: ” Tak ekki þinn heilaga anda frá mér “ , segir Davíð í sama sálmi .
- PRON 6: Þetta sama haust kom Björn Sæmundarson sunnan til Sauðafells að heimboði .
- VERB 3: ” Ei er hér gestkvæmt “ sagði hún “ og mun illa sama að vísa þeim frá húsum sem til koma allra helst ef þeim er ókunnugt .
- ADV 2: Nú var henni í raun og veru orðið sama um þetta alt .
- gott
- ADJ 283: Verður honum nú gott bæði til fjár og mannheilla .
- NOUN 9: Þá voru ungir menn glaðir hyggjandi gott til þessarar skemmtanar stökkvandi á sína hesta .
- ADV 1: En til þess að eigi verði oss Adams dæmi , er eigi kunni gott þiggja sjálfur , þá sælu , er honum var veitt , hefir Drottinn vor eigi enn öll synda víti af oss tekið , það er bæði erfiði og mæði og mörg þessa heims meinsemi , sótt og dauði , sorg og umhugi , hungur og þorsti , volað og vílsiðr .
- X 1: Þar af fengu illmennin stóran ótta , svo sem að væru þeir dauðvona , og um miðnætti nærri , þá gekk svo yfir þetta stóra skip , að þann stóra bátinn , sem þeir kalla slúffur , sleit upp undan öllum festum á þiljum og keyrði út á hlé og þar með í sundur , og þar með fór út einn af þeim kristnu , sem að var spanskur , en annar lestist í handlegg og mátti þó samt út á rámúlann , og þaðan datt hann út í sjó , og meina eg að þýzkur væri , því að hann sagði með upplyftum höndum og augum : “ Hilf mir , herr gott ! “
- góða
- satt
- fyrsta
- fyrstu
- þriðja
- ADJ 121: En það hið þriðja er að fellur eiðurinn má kalla nokkuð sveigt .
- NOUN 1: Sennilega hefði hann þó hrokkið skammt , einn var með byssu , annar barefli og glampaði á hníf í hendi hins þriðja .
- NUM 1: Hann gerði á hvern þann mann er víg hafði vakið í Bæ tíu hundrað en fimm hundrað á þá er menn höfðu sært en hálft þriðja hundrað á þá er grjóti höfðu kastað .
- heilaga
- sæla
- næsta
Morphology
The form / lemma ratio of ADJ
is 2.028708 (the average of all parts of speech is 1.856953).
The 1st highest number of forms (31) was observed with the lemma “góður”: best, besta, bestan, bestar, besti, bestir, bestrar, bestu, bestum, bestur, betra, betri, betur, bezt, bezta, beztan, beztu, gott, góð, góða, góðan, góðar, góði, góðir, góðra, góðrar, góðri, góðs, góðu, góðum, góður.
The 2nd highest number of forms (29) was observed with the lemma “hár”: ho, há, háa, háan, háar, háir, hám, hár, hárra, hárri, hás, hátt, háu, háum, háva, hávir, hávum, hæri, hærra, hærri, hæst, hæsta, hæsti, hæstu, hæstum, hæstur, hæðsta, hæðsti, hǫ.
The 3rd highest number of forms (24) was observed with the lemma “íslenskur”: Íslenzkir, íslendskra, íslensk, íslenska, íslenskan, íslenskar, íslenski, íslenskir, íslenskra, íslenskrar, íslenskri, íslensks, íslenskt, íslensku, íslenskum, íslenskur, íslenzka, íslenzkan, íslenzkar, íslenzkari, íslenzkri, íslenzku, íslenzkum, íslenzkur.
ADJ
occurs with 13 features: Number (35567; 96% instances), Case (35297; 95% instances), Gender (35276; 95% instances), Definite (33565; 90% instances), Degree (31986; 86% instances), PronType (819; 2% instances), VerbForm (557; 1% instances), Voice (557; 1% instances), Mood (283; 1% instances), Person (283; 1% instances), Tense (283; 1% instances), NumType (212; 1% instances), Foreign (46; 0% instances)
ADJ
occurs with 35 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Nom
, Definite=Def
, Definite=Ind
, Degree=Cmp
, Degree=Pos
, Degree=Sup
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Mood=Imp
, Mood=Ind
, Mood=Sub
, NumType=Card
, NumType=Frac
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
, VerbForm=Sup
, Voice=Act
, Voice=Mid
ADJ
occurs with 295 feature combinations.
The most frequent feature combination is Case=Nom|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing
(5216 tokens).
Examples: góður, gamall, dauður, fullur, heilagur, glaður, stór, staddur, sterkur, reiður
Relations
ADJ
nodes are attached to their parents using 19 different relations: amod (25356; 68% instances), ccomp (2316; 6% instances), conj (2132; 6% instances), root (1838; 5% instances), obl (1740; 5% instances), xcomp (877; 2% instances), advcl (773; 2% instances), acl:relcl (673; 2% instances), nsubj (471; 1% instances), obj (434; 1% instances), acl (312; 1% instances), nmod:poss (85; 0% instances), appos (55; 0% instances), iobj (36; 0% instances), vocative (33; 0% instances), dep (15; 0% instances), parataxis (6; 0% instances), advmod (5; 0% instances), fixed (1; 0% instances)
Parents of ADJ
nodes belong to 16 different parts of speech: NOUN (17254; 46% instances), VERB (9603; 26% instances), ADJ (2978; 8% instances), (1838; 5% instances), PROPN (1387; 4% instances), PRON (1361; 4% instances), DET (1310; 4% instances), ADV (713; 2% instances), AUX (380; 1% instances), X (97; 0% instances), PART (70; 0% instances), CCONJ (57; 0% instances), NUM (56; 0% instances), ADP (27; 0% instances), SCONJ (20; 0% instances), INTJ (7; 0% instances)
20578 (55%) ADJ
nodes are leaves.
6063 (16%) ADJ
nodes have one child.
3592 (10%) ADJ
nodes have two children.
6925 (19%) ADJ
nodes have three or more children.
The highest child degree of a ADJ
node is 18.
Children of ADJ
nodes are attached using 31 different relations: amod (6552; 15% instances), punct (6353; 14% instances), cop (5852; 13% instances), nsubj (5144; 11% instances), cc (3921; 9% instances), obl (3768; 8% instances), advmod (2695; 6% instances), conj (2490; 6% instances), mark (2329; 5% instances), case (1369; 3% instances), advcl (887; 2% instances), det (741; 2% instances), ccomp (490; 1% instances), aux (306; 1% instances), acl:relcl (279; 1% instances), acl (249; 1% instances), nmod:poss (238; 1% instances), xcomp (208; 0% instances), obj (191; 0% instances), expl (187; 0% instances), compound:prt (114; 0% instances), dep (106; 0% instances), appos (98; 0% instances), vocative (89; 0% instances), parataxis (52; 0% instances), discourse (46; 0% instances), iobj (27; 0% instances), nummod (26; 0% instances), nmod (25; 0% instances), flat:foreign (8; 0% instances), flat:name (4; 0% instances)
Children of ADJ
nodes belong to 16 different parts of speech: PUNCT (6353; 14% instances), AUX (6273; 14% instances), NOUN (5774; 13% instances), ADV (4952; 11% instances), PRON (4200; 9% instances), CCONJ (4117; 9% instances), VERB (3356; 7% instances), ADJ (2978; 7% instances), SCONJ (2212; 5% instances), DET (1874; 4% instances), ADP (1571; 4% instances), PROPN (871; 2% instances), PART (187; 0% instances), NUM (58; 0% instances), INTJ (45; 0% instances), X (23; 0% instances)