Treebank Statistics: UD_Icelandic-IcePaHC: POS Tags: NOUN
There are 18242 NOUN
lemmas (48%), 32207 NOUN
types (45%) and 145881 NOUN
tokens (15%).
Out of 16 observed tags, the rank of NOUN
is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: maður, dagur, konungur, biskup, hönd, land, orð, kóngur, sonur, faðir
The 10 most frequent NOUN
types: menn, maður, konungur, manna, biskup, mönnum, móti, orð, dag, tíma
The 10 most frequent ambiguous lemmas: maður (NOUN 6728, PROPN 8, PRON 5, ADV 3, INTJ 1), dagur (NOUN 1610, PROPN 4, ADV 2), konungur (NOUN 1608, PROPN 5), biskup (NOUN 1355, PROPN 56), orð (NOUN 1087, VERB 1), kóngur (NOUN 1021, PROPN 12), sonur (NOUN 987, PROPN 15), faðir (NOUN 959, PROPN 37, ADV 2), staður (NOUN 944, PROPN 36, ADJ 2, ADV 2), bróðir (NOUN 854, PROPN 3)
The 10 most frequent ambiguous types: menn (NOUN 2207, ADV 1), maður (NOUN 1439, PRON 4, INTJ 1), konungur (NOUN 710, PROPN 2), manna (NOUN 811, ADV 1, VERB 1), biskup (NOUN 682, PROPN 35), móti (NOUN 686, ADP 16, ADV 2, VERB 1, X 1), dag (NOUN 565, ADV 2), tíma (NOUN 483, ADV 1, VERB 1), stað (NOUN 474, PROPN 2), kóngur (NOUN 342, PROPN 1)
- menn
- maður
- konungur
- manna
- NOUN 811: En er þinga skyldi um mál manna .
- ADV 1: Um allt þetta skyldu gerast 3 genpartar , með þeirra sem og tveggja erlegra manna undirskriftum , yfir það sem virt væri . Og sá eini genparturinn afhendast höfuðsmanninum , en hinn annar liggja á kirkjunum .
- VERB 1: En þeir afsökuðu sig fyrir mér að þeir kynni ekki fremri aðgjörðir að hafa vegna alþingismanna gjörninga og samþykkta , hverjum þeir vændust , fram yfir hverjar samþykktir þeir þóttust ekki mega sig taka , hvað ég varð einnin þeim að vorkynna að því leyti , því ég þekkti og vissi margra þeirra manna meðaumkun sem í dómnum voru að þeir mundu mér hjálpað hafa ef þar hefði góðan máta og meðul tilséð eða skynjað . Hvers réttargangs og lagavegar ef svo má nefnast að bæði ég og margir aðrir urðu að gjalda og hefði ómetanlega goldið hefði ekki Drottinn Guð sent oss sína heilaga engla til verndar og varðveislu , svo öll þessi sveit eða kannske meiri partur af þessu landi gekk ekki aldeilis til grunna , hvar um ég á eftir meira að skrifa annarstaðar .
- biskup
- móti
- NOUN 686: En er hann kom gegnt þingstöð þá kom þar Íri hlaupandi móti honum .
- ADP 16: Kristófer sagði þeir mundu varla óttast að koma móti þeim , og við það felldu þeir talið .
- ADV 2: Þær báðu honum ills á móti .
- VERB 1: Gef það , herra Jesú , að mín sál neyti og með réttri trú þinnar náðar móti svo að eg saddur verði af ríkuglegum gæðum þíns húss .
- X 1: Og nær þeirra var fjörutíu faðmar á milli orðið , sté kóngur og öll hans fylgd af sínum hestum , biskupinn í sama máta , og gekk svo hvor í móti öðrum með ljúflegri aðferð , auðmýkt og reverentsíu , og laut hvor að öðrum , þrisvar til hægri og vinstri síðu .
- dag
- tíma
- NOUN 483: 1 Á einum tíma var einn ríkur maður .
- ADV 1: ” Þetta eyðir fyrir mér allt of löngum tíma , “ sagði Þórður prestur , “ og mun ég ekki heimsækja þig að þessu sinni .
- VERB 1: Indriði kom þá að máli við móður sína - og vildi ég , segir hann , að þú , móðir , minntist þess , er þú hést mér , að vekja máls á bónorðinu , og mun ekki annan tíma betra færi á gefast .
- stað
- kóngur
Morphology
The form / lemma ratio of NOUN
is 1.765541 (the average of all parts of speech is 1.856953).
The 1st highest number of forms (22) was observed with the lemma “biskup”: bikupinn, bikupinum, biskup, biskupa, biskupana, biskupanna, biskupar, biskuparnir, biskupi, biskupinn, biskupinum, biskupnum, biskups, biskupsins, biskupum, biskupunum, byskup, byskupar, byskupi, byskupinn, byskupinum, byskups.
The 2nd highest number of forms (21) was observed with the lemma “maður”: mann, manna, manna-, mannanna, manni, manninn, manninum, manns, mannsins, maðr, maður, maðurinn, men, menn, mennina, menninir, mennirnir, mönnu, mönnum, mönnunum, mönnönum.
The 3rd highest number of forms (18) was observed with the lemma “staður”: stadinn, stadur, stað, staðar, staðarins, staði, staðin, staðina, staðinn, staðins, staðinum, staðir, staðirnir, staðnum, staður, staðurinn, stöðum, stöðunum.
NOUN
occurs with 13 features: Number (143432; 98% instances), Case (143058; 98% instances), Gender (142915; 98% instances), Definite (142559; 98% instances), Degree (1124; 1% instances), VerbForm (557; 0% instances), Voice (557; 0% instances), Person (420; 0% instances), Mood (374; 0% instances), Tense (374; 0% instances), Foreign (317; 0% instances), PronType (252; 0% instances), NumType (91; 0% instances)
NOUN
occurs with 36 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Nom
, Definite=Def
, Definite=Ind
, Degree=Cmp
, Degree=Pos
, Degree=Sup
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Mood=Imp
, Mood=Ind
, Mood=Sub
, NumType=Card
, NumType=Frac
, NumType=Ord
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
, VerbForm=Sup
, Voice=Act
, Voice=Mid
NOUN
occurs with 247 feature combinations.
The most frequent feature combination is Case=Nom|Definite=Ind|Gender=Masc|Number=Sing
(12627 tokens).
Examples: maður, konungur, biskup, kóngur, faðir, herra, prestur, jarl, sonur, bóndi
Relations
NOUN
nodes are attached to their parents using 21 different relations: obl (56918; 39% instances), obj (25918; 18% instances), nsubj (23961; 16% instances), conj (13493; 9% instances), nmod:poss (7929; 5% instances), appos (5197; 4% instances), root (2619; 2% instances), xcomp (2511; 2% instances), advcl (1844; 1% instances), ccomp (1451; 1% instances), iobj (1104; 1% instances), vocative (890; 1% instances), amod (808; 1% instances), acl:relcl (639; 0% instances), acl (307; 0% instances), dep (173; 0% instances), parataxis (80; 0% instances), discourse (15; 0% instances), nmod (15; 0% instances), nummod (8; 0% instances), flat:foreign (1; 0% instances)
Parents of NOUN
nodes belong to 16 different parts of speech: VERB (96381; 66% instances), NOUN (24062; 16% instances), ADJ (5774; 4% instances), PROPN (5207; 4% instances), PRON (3864; 3% instances), (2619; 2% instances), AUX (2521; 2% instances), ADV (2439; 2% instances), DET (1429; 1% instances), ADP (400; 0% instances), NUM (369; 0% instances), PART (348; 0% instances), X (224; 0% instances), CCONJ (194; 0% instances), SCONJ (26; 0% instances), INTJ (24; 0% instances)
29528 (20%) NOUN
nodes are leaves.
48048 (33%) NOUN
nodes have one child.
39513 (27%) NOUN
nodes have two children.
28792 (20%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 35.
Children of NOUN
nodes are attached using 31 different relations: case (53302; 23% instances), punct (39092; 17% instances), nmod:poss (30687; 13% instances), amod (27749; 12% instances), det (16900; 7% instances), cc (11988; 5% instances), conj (11841; 5% instances), obl (7631; 3% instances), acl:relcl (6587; 3% instances), advmod (5580; 2% instances), cop (5530; 2% instances), nsubj (3808; 2% instances), mark (3126; 1% instances), nummod (2538; 1% instances), appos (2280; 1% instances), compound:prt (1743; 1% instances), advcl (914; 0% instances), ccomp (797; 0% instances), xcomp (668; 0% instances), nmod (653; 0% instances), dep (448; 0% instances), acl (418; 0% instances), obj (371; 0% instances), aux (200; 0% instances), expl (112; 0% instances), discourse (103; 0% instances), parataxis (55; 0% instances), vocative (39; 0% instances), flat:foreign (28; 0% instances), iobj (26; 0% instances), csubj (1; 0% instances)
Children of NOUN
nodes belong to 16 different parts of speech: ADP (55220; 23% instances), PUNCT (39092; 17% instances), DET (27033; 11% instances), PRON (24940; 11% instances), NOUN (24062; 10% instances), ADJ (17254; 7% instances), CCONJ (12065; 5% instances), VERB (9715; 4% instances), PROPN (7326; 3% instances), AUX (6188; 3% instances), ADV (5998; 3% instances), SCONJ (3062; 1% instances), NUM (2701; 1% instances), X (332; 0% instances), PART (127; 0% instances), INTJ (100; 0% instances)