Treebank Statistics: UD_Turkish-Penn: POS Tags: NOUN
There are 6215 NOUN
lemmas (34%), 18325 NOUN
types (50%) and 66720 NOUN
tokens (36%).
Out of 15 observed tags, the rank of NOUN
is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: bay, dolar, hisse, ol, şirket, yıl, piyasa, fiyat, et, iş
The 10 most frequent NOUN
types: bay, hisse, dolar, yıl, şirket, olduğunu, şekilde, satın, devam, gelir
The 10 most frequent ambiguous lemmas: bay (NOUN 1048, VERB 1), dolar (NOUN 1001, ADJ 102, VERB 34, PROPN 22), hisse (NOUN 997, ADJ 15, VERB 4, ADV 1), ol (NOUN 945, VERB 930, ADV 879, ADJ 617), şirket (NOUN 836, VERB 21, ADJ 10, PROPN 1), yıl (NOUN 753, ADJ 174, ADV 28, VERB 2), piyasa (NOUN 488, ADJ 39, PROPN 1), fiyat (NOUN 433, ADJ 24, VERB 5), et (VERB 1089, NOUN 416, ADJ 285, ADV 37), iş (NOUN 401, ADJ 7, VERB 2)
The 10 most frequent ambiguous types: dolar (NOUN 374, NUM 5), şirket (NOUN 175, ADJ 1), gelir (NOUN 77, VERB 10), Amerikan (NOUN 179, ADJ 115, PROPN 1), konusunda (NOUN 156, ADV 1), menkul (NOUN 60, ADJ 33), alım (NOUN 130, VERB 1), yatırım (NOUN 118, VERB 1), tarafından (ADV 186, NOUN 128), satış (NOUN 101, VERB 2)
- dolar
- şirket
- gelir
- Amerikan
- konusunda
- menkul
- alım
- yatırım
- tarafından
- satış
Morphology
The form / lemma ratio of NOUN
is 2.948512 (the average of all parts of speech is 2.012465).
The 1st highest number of forms (98) was observed with the lemma “et”: EDİLMESİ, ETLER, Etler, edebildiğine, edebileceklerini, edebileceği, edebileceğine, edebileceğini, edebileceğinin, edebileceğiniz, edebilme, edebilmeyi, edeceklerine, edeceklerini, edeceğinden, edeceğine, edeceğini, edemediklerini, edememeleri, edememesinden, edemeyeceğimizden, edemeyeceğini, edemeyeceğinin, edemezsin, edenler, edenlere, edenlerin, ederinde, edici, edildikten, edildiği, edildiğince, edildiğinde, edildiğini, edileceği, edileceğini, edilemeyeceğini, edilenden, edilenlerden, edilme, edilmediği, edilmediğinden, edilmediğini, edilmek, edilmesi, edilmesinde, edilmesine, edilmesini, edilmesinin, edilmesiyle, edilmeye, edilmişlerden, et, eti, etin, etinin, etme, etmede, etmediğini, etmek, etmekle, etmekte, etmekten, etmelisiniz, etmemem, etmemesi, etmemeye, etmemeyi, etmemi, etmemizi, etmenin, etmesi, etmesine, etmesini, etmesinin, etmeye, etmeyecekleri, etmeyeceklerini, etmeyeceğini, etmeyi, ettikleri, ettiklerinde, ettiklerini, ettikten, ettireceğini, ettirme, ettirmediler, ettirmeye, ettirmeyi, ettiği, ettiğimiz, ettiğinde, ettiğinden, ettiğine, ettiğini, ettiğiniz, tutmak, yaptığına.
The 2nd highest number of forms (88) was observed with the lemma “ol”: kaldığını, olabilecekleri, olabileceklerin, olabileceklerini, olabileceğinden, olabileceğine, olabileceğini, olabileceğinin, olabilirler, olabilmesi, olacaklar, olacaklarını, olacağı, olacağımı, olacağına, olacağından, olacağını, olacağının, olamadığını, olamayacağını, olana, olandan, olanlar, olanlardan, olanları, olanların, olanı, olanın, oldukları, olduklarına, olduklarında, olduklarından, olduklarını, olduktan, olduğu, olduğum, olduğumdan, olduğumu, olduğumuzu, olduğuna, olduğunda, olduğundan, olduğunu, olduğunun, olma, olmadan, olmadıkları, olmadıklarını, olmadığı, olmadığımızı, olmadığına, olmadığında, olmadığını, olmak, olmakla, olmakta, olmaktan, olmaları, olmalarına, olmalarını, olmamakla, olmamanın, olmaması, olmamasına, olmamasını, olman, olmanın, olması, olmasına, olmasında, olmasından, olmasını, olmasının, olmasıyla, olmaya, olmayabileceğini, olmayacakları, olmayacağı, olmayacağını, olmayacağının, olmayanlar, olmayanlara, olmayanların, olmayı, olmayışı, olunmaya, oluşuyla, var.
The 3rd highest number of forms (68) was observed with the lemma “al”: Alacağın, alabileceğini, alabilme, alacaklara, alacaklarda, alacaklarının, alacağa, alacağımızı, alacağını, alamayacaklarını, alamayacağını, alana, alanlar, alanlarında, alanı, aldıklarını, aldıktan, aldığı, aldığımı, aldığına, aldığında, aldığını, alma, almada, almadan, almadığını, almak, almakta, almaktan, almalar, almalara, almalardan, almalarla, almaları, almalarına, almalarını, almanın, almanız, almanızı, alması, almasına, almasından, almasını, almasının, almasıyla, almaya, almayacaklarını, almayla, almayı, alıcı, alıcılar, alıcılarından, alıcının, alım, alımı, alınacağını, alındıktan, alındığında, alındığından, alındığını, alınma, alınmaması, alınması, alınmasına, alınmasından, alınmasını, alınmayı, alışımız.
NOUN
occurs with 6 features: Number (66720; 100% instances), Person (66720; 100% instances), Case (66693; 100% instances), Number[psor] (21757; 33% instances), Person[psor] (21757; 33% instances), Typo (13; 0% instances)
NOUN
occurs with 16 feature-value pairs: Case=Abl
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Number=Plur
, Number=Sing
, Number[psor]=Plur
, Number[psor]=Sing
, Person=3
, Person[psor]=1
, Person[psor]=2
, Person[psor]=3
, Typo=Yes
NOUN
occurs with 98 feature combinations.
The most frequent feature combination is Case=Nom|Number=Sing|Person=3
(27697 tokens).
Examples: bay, hisse, dolar, yıl, şirket, devam, satın, gelir, dün, Amerikan
Relations
NOUN
nodes are attached to their parents using 29 different relations: nmod (21522; 32% instances), nsubj (11449; 17% instances), obl (9092; 14% instances), obj (7662; 11% instances), compound (5995; 9% instances), ccomp (2363; 4% instances), amod (2041; 3% instances), conj (1743; 3% instances), root (1546; 2% instances), advcl (640; 1% instances), xcomp (499; 1% instances), flat (438; 1% instances), csubj (364; 1% instances), case (323; 0% instances), nummod (227; 0% instances), appos (193; 0% instances), acl (181; 0% instances), list (112; 0% instances), discourse (109; 0% instances), parataxis (104; 0% instances), fixed (61; 0% instances), iobj (22; 0% instances), clf (15; 0% instances), dep (7; 0% instances), dislocated (4; 0% instances), vocative (4; 0% instances), nsubj:outer (2; 0% instances), nmod:tmod (1; 0% instances), orphan (1; 0% instances)
Parents of NOUN
nodes belong to 15 different parts of speech: NOUN (27445; 41% instances), VERB (27075; 41% instances), ADJ (5586; 8% instances), ADV (2104; 3% instances), PROPN (2099; 3% instances), (1546; 2% instances), NUM (373; 1% instances), PRON (229; 0% instances), ADP (119; 0% instances), DET (77; 0% instances), X (22; 0% instances), AUX (19; 0% instances), CCONJ (15; 0% instances), INTJ (10; 0% instances), SCONJ (1; 0% instances)
22786 (34%) NOUN
nodes are leaves.
26643 (40%) NOUN
nodes have one child.
11605 (17%) NOUN
nodes have two children.
5686 (9%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 11.
Children of NOUN
nodes are attached using 33 different relations: nmod (19936; 29% instances), amod (12327; 18% instances), det (5572; 8% instances), nummod (4105; 6% instances), case (3423; 5% instances), punct (3380; 5% instances), compound (2964; 4% instances), acl (2580; 4% instances), nsubj (2567; 4% instances), obj (2425; 3% instances), obl (2199; 3% instances), advmod (2075; 3% instances), conj (1721; 2% instances), cc (1711; 2% instances), mark (563; 1% instances), flat (389; 1% instances), advcl (366; 1% instances), appos (340; 0% instances), ccomp (258; 0% instances), aux (225; 0% instances), xcomp (161; 0% instances), list (154; 0% instances), discourse (144; 0% instances), parataxis (90; 0% instances), csubj (85; 0% instances), dep (33; 0% instances), fixed (31; 0% instances), goeswith (13; 0% instances), clf (6; 0% instances), iobj (5; 0% instances), dislocated (4; 0% instances), nsubj:outer (1; 0% instances), orphan (1; 0% instances)
Children of NOUN
nodes belong to 15 different parts of speech: NOUN (27445; 39% instances), ADJ (13995; 20% instances), DET (5781; 8% instances), PROPN (5183; 7% instances), NUM (4536; 6% instances), PUNCT (3380; 5% instances), ADP (2772; 4% instances), CCONJ (2550; 4% instances), ADV (2460; 4% instances), PRON (939; 1% instances), VERB (406; 1% instances), AUX (227; 0% instances), X (163; 0% instances), INTJ (10; 0% instances), SCONJ (7; 0% instances)