Treebank Statistics: UD_Norwegian-Nynorsk: POS Tags: X
There are 687 X
lemmas (3%), 687 X
types (2%) and 1185 X
tokens (0%).
Out of 17 observed tags, the rank of X
is: 6 in number of lemmas, 6 in number of types and 15 in number of tokens.
The 10 most frequent X
lemmas: of, og, det, en, i, the, for, som, til, den
The 10 most frequent X
types: of, og, det, en, i, the, for, som, til, den
The 10 most frequent ambiguous lemmas: of (X 35, ADP 6), og (CCONJ 8213, X 28, ADV 17), det (PRON 5532, DET 1337, X 16), en (X 22, DET 5, ADP 1), i (ADP 9533, ADV 84, X 19, NOUN 3), the (X 20, DET 7, NUM 1), for (ADP 3646, ADV 205, CCONJ 100, X 18), som (SCONJ 3460, ADP 1330, X 19, ADV 5), til (ADP 4375, ADV 223, SCONJ 40, X 16, PROPN 1), den (DET 1927, PRON 148, X 12, PROPN 1)
The 10 most frequent ambiguous types: of (X 35, ADP 6), og (CCONJ 7882, X 28, ADV 16, PART 3), det (PRON 4104, DET 1165, X 16, ADV 1), en (X 22, DET 7, ADP 1), i (ADP 8728, ADV 81, X 19, NOUN 3), the (X 20, DET 7, NUM 1), for (ADP 3509, ADV 197, CCONJ 52, X 18, VERB 1), som (SCONJ 3434, ADP 1268, X 19, ADV 5), til (ADP 4296, ADV 223, SCONJ 40, X 16, PROPN 1), den (DET 1665, PRON 115, X 12)
- of
- og
- det
- PRON 4104: Slik gjer eg det :
- DET 1165: … Er ofte det beste .
- X 16: den trenger det . »
- ADV 1: Dette samanfallet , pluss det faktum at Ronald Reagan gjekk i sin andre presidentperiode i 1984 , fekk nyleg ein filmkritikar i New York til å skriva at « ein ny episode i Terminator-franchisen er på veg , det må det bety at ein republikansk president stiller til attval » .
- en
- X 22: Det problemet får en ikke løst så lenge vi er utenfor EU . »
- DET 7: - Det er ein innsats som ikkje kan ha en uendeleg tidshorisont .
- ADP 1: 4 1.2.2.3 Danmark I Danmark utarbeidde eit hurtigarbeidande utval nedsett av Kulturministeriet i 2003 ein rapport med tittelen Sprog på spil - et udspil til en dansk sprogpolitik .
- i
- ADP 8728: Det får eg når eg bakar brødet i former .
- ADV 81: Varm opp steikepanna , og ha i smør .
- X 19: Ved en feiltakelse hadde et avsnitt blitt borte i papirutgaven .
- NOUN 3: Den nynorske formi vi kann ikkje førast attende på vér ( nokon ljodyvergang frå é til i er ikkje kjend ) , men er lånt frå dansk og svensk .
- the
- X 20: Human Nature and the Limits of Science .
- DET 7: I DKK er dei “ Doctors of the church “ , men kva er dei i vår kyrkje ?
- NUM 1: Men å degradere gjensidig forståing og rasjonell vurdering i « the community of investigators » til ( kausalt produserte ) naturhendingar , er å gå til åtak på den form for rasjonell aktivitet som naturvitskapen utgjer .
- for
- ADP 3509: Motoren byrja fyrst å gå for fullt att for fåe år sidan .
- ADV 197: Grove brød er sunt , men små barn bør ikkje få for grovt brød .
- CCONJ 52: Eg meiner ikkje å seie at alt er gale i Dnk , for det er det ikkje .
- X 18: Så kan vi klare oss med 363 dagers ekstrainntekter helt for oss selv ? »
- VERB 1: Mandag for ho på sjukehuset , og då ho kom heimatt på fredag møtte mannen hennar henne med denne helsinga :
- som
- til
- ADP 4296: Smør til steiking
- ADV 223: La brøda etterheve godt , minst ein time til .
- SCONJ 40: Steik brøda i 40 - 45 minutt til dei er ferdige .
- X 16: « Skal vi omdanne vårt folk til en søppelkasse rasebiologisk sett ? » )
- PROPN 1: Jamfør eit augevitne frå glanstida til filmen , sprang mange ut av salen då det gjekk opp for dei at det var ein pornofilm dei hadde kjøpt billett til .
- den
Morphology
The form / lemma ratio of X
is 1.000000 (the average of all parts of speech is 1.346455).
The 1st highest number of forms (1) was observed with the lemma “-e-”: -e-.
The 2nd highest number of forms (1) was observed with the lemma “07.30”: 07.30.
The 3rd highest number of forms (1) was observed with the lemma “09.00”: 09.00.
X
does not occur with any features.
Relations
X
nodes are attached to their parents using 15 different relations: flat:foreign (866; 73% instances), flat:name (165; 14% instances), root (61; 5% instances), appos (19; 2% instances), ccomp (13; 1% instances), obj (13; 1% instances), compound (10; 1% instances), obl (10; 1% instances), xcomp (8; 1% instances), conj (7; 1% instances), nmod (5; 0% instances), nsubj (5; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances), nsubj:pass (1; 0% instances)
Parents of X
nodes belong to 6 different parts of speech: X (792; 67% instances), PROPN (249; 21% instances), (61; 5% instances), VERB (42; 4% instances), NOUN (35; 3% instances), ADJ (6; 1% instances)
1008 (85%) X
nodes are leaves.
62 (5%) X
nodes have one child.
11 (1%) X
nodes have two children.
104 (9%) X
nodes have three or more children.
The highest child degree of a X
node is 40.
Children of X
nodes are attached using 16 different relations: flat:foreign (793; 68% instances), punct (304; 26% instances), case (19; 2% instances), mark (12; 1% instances), conj (7; 1% instances), cc (5; 0% instances), nsubj (5; 0% instances), cop (4; 0% instances), obl (4; 0% instances), acl:relcl (2; 0% instances), advcl (2; 0% instances), advmod (2; 0% instances), parataxis (2; 0% instances), amod (1; 0% instances), det (1; 0% instances), xcomp (1; 0% instances)
Children of X
nodes belong to 14 different parts of speech: X (792; 68% instances), PUNCT (304; 26% instances), ADP (20; 2% instances), SCONJ (12; 1% instances), NOUN (9; 1% instances), VERB (6; 1% instances), CCONJ (5; 0% instances), ADJ (4; 0% instances), AUX (4; 0% instances), NUM (3; 0% instances), PROPN (2; 0% instances), ADV (1; 0% instances), DET (1; 0% instances), SYM (1; 0% instances)