home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Thai-PUD: POS Tags: PROPN

There are 1 PROPN lemmas (6%), 956 PROPN types (22%) and 1491 PROPN tokens (7%). Out of 16 observed tags, the rank of PROPN is: 11 in number of lemmas, 3 in number of types and 4 in number of tokens.

The 10 most frequent PROPN lemmas: _

The 10 most frequent PROPN types: จีน, ยุโรป, อังกฤษ, อเมริกา, ฝรั่งเศส, สเปน, ทรัมป์, รัสเซีย, ออสเตรเลีย, อเมริกัน

The 10 most frequent ambiguous lemmas: _ (NOUN 6052, VERB 4361, ADP 3134, PROPN 1491, AUX 1449, DET 1026, ADJ 969, ADV 951, PRON 683, PART 608, CCONJ 606, NUM 581, PUNCT 272, SYM 134, X 4, SCONJ 1)

The 10 most frequent ambiguous types: ครั้ง (NOUN 55, PROPN 5), ชิง (PROPN 5, VERB 3), ดี (ADJ 24, ADV 6, PROPN 3), โลก (NOUN 36, PROPN 3), ดำ (PROPN 2, ADJ 1, VERB 1), บลันต์ (PROPN 2, NOUN 1), บอลข่าน (PROPN 2, NOUN 1), หวัง (VERB 3, PROPN 2), กลาสโกว์ (NOUN 1, PROPN 1), จันทร์ (NOUN 2, PROPN 1)

Morphology

The form / lemma ratio of PROPN is 956.000000 (the average of all parts of speech is 269.375000).

The 1st highest number of forms (956) was observed with the lemma “_”: AKP, Antillas, Brexit, CGI, DFB, DPA, ETA, F1, FSLN, Figaro, GEMA, Google, IRENA, LUISS, Le, Marat, Mestre, NATO, SPIEGEL, Sade, Vine, YouTube, Évole, กราฟตัน, กราวิตี้, กรีก, กรีซ, กรุงเทพมหานคร, กลยุทธ์, กลอเรีย, กลาสโกว์, กลาเร็ต, กลินดา, กวม, กวางโจว, กวารอน, กอนซาเลซ, กอนท์, กอร์ดอน-เลวิตต์, กั๋ว, กาปัว, การากัลลา, การ์กัสซอน, การ์ธ, การ์ราร์ด, การ์ลอส, กาลาเบรีย, กาเซ็ตต์, กิลลาร์ด, กิลโบลท์, กีเยอร์, กุนเธอร์, กูมี, กูรี, คงมิน, ครัสโนยาสค์, ครั้ง, ครานัค, คราเมอร์, คริส, คริสติน, คริสตินา, คริสต์, คริสต์กาล, คริสเตียน, คริสเตียนซันด์, คริสโตเฟอร์, คลินตัน, ควิเบก, คองโก, คอร์ซิกา, คอร์ราโด, คอสพีดัล, คอเคซัส, คัมชัตคา, คัมเบอร์แลนด์, คาซ่า, คาตาลาโน่, คาทอลิก, คานซีร์, คานาอัน, คารังจี, คาริบ, คาร์นัก, คาร์ลอส, คาร์สัน, คาร์เตอร์, คาสเทลฟรังโกเวเนโต, คาเดช, คาเบียร์, คาเรล, คิกาลี, คิคิ, คิง, คิปลิง, คิม, คิลิมันจาโร, คิวบา, คิวริโอ, คิเลีย, คีร่า, คีร์รีมูร์, คุห์น, คูรานต์, ค็อตตอน, จอร์จ, จอร์จทาวน์, จอห์น, จอห์นนี, จอห์นสัน, จันทร์, จัสมิน, จาดาน, จินผิงเหมย, จิม, จิมมี, จีซีเอ, จีซีเอชคิว, จีน, จีเอ็ม, จีโอพี, จุททิง, จูเนียร์, จูเลียต, จูเลียน, ชาร์ลส์, ชิง, ชี่ตัน, ชูลแมน, ซอเมอร์เซ็ต, ซักเคอร์เบิร์ก, ซันเดอร์แลนด์, ซัมซุง, ซาคิบ, ซานตา, ซานฟรานซิสโก, ซานเชส, ซาบรีนา, ซามิ, ซาราห์, ซาราโตก้า, ซาร่า, ซาร์โกซี, ซาลส์บูร์ก, ซาลามาน, ซาลาส, ซาสค์เทล, ซาอูล, ซาฮาร่า, ซาฮาลิน, ซาเฮล, ซาแลร์โน, ซาโฮรี, ซิกูร์, ซิซิลี, ซิซิเลีย, ซิฟูเอ็นเตส, ซิมเมอร์, ซิลิคอนวัลเลย์, ซิสคอเคซัส, ซี, ซีกัล, ซีซาร์, ซีทีวี, ซีบีซี, ซีบีเอส, ซีอาร์ทีซี, ซีเกล, ซีเอ็นเอ็น, ซึดบาเดิน, ซื่อไข่, ซุลลา, ซูบีอันโต, ซูเดเทิน, ญี่ปุ่น, ดอร์เซ็ต, ดอส, ดักลาส, ดัตช์, ดัฟฟี่, ดาติ, ดานูบ, ดาริอุส, ดาร์นองด์, ดำ, ดิซีโบเดนเบิร์ก, ดิสนีย์, ดิสแพตช์, ดี, ดีทริช, ดีน, ดีส, ดุนดาร์, ดูรัน, ติชิโน, ตินติน, ติแบริอุส, ตุรกี, ตูนิป, ทรอม, ทรอย, ทรัมป์, ทรานส์คอเคซัส, ทริกซ์, ทรูโด, ทวิตเตอร์, ทอม, ทอมป์สัน, ทอรี่, ทอเล, ทะเลเหนือ, ทะเลใต้, ทาร์โล, ทาลมัดจ์, ทาเปีย, ทิโอมาน, ที, ทีนา, ทุตโมส, ทุลชาเคาน์ตี, ธานอส, นอตต์, นอร์ท, นอร์ทเคสเตเวน, นอร์ทแคโรไลนา, นอร์ธแคโรไลนา, นอร์ธแฮมป์ตัน, นอร์มา, นอร์เวย์, นอร์แมน, นาซี, นานกิง, นาสคาร์, นิวตัน, นิวฟรานซ์, นิวยอร์ก, นิโคลัส, นิโคลาส์, นิโคไล, นีแกน, นโปเลียน, น็อตติงแฮม, บรอยน์, บราซิล, บริซ, บริติชโคลัมเบีย, บริสเบน, บริเตน, บริเตนใหญ่, บรูคส์, บรูซ, บรูโน, บลันต์, บลินด์เลยา, บล็อค, บอยส์ท, บอลข่าน, บอลติก, บอสฟอรัส, บันตู, บัวโนส, บาซิลิกาตา, บาดาร์ปูร์, บารอน, บาร์เรตต์, บาร์โรโซ, บาฮากาลิฟอร์เนีย, บาเยซ, บิล, บิลบอร์ด, บีบีซี, บีเอ, บีไอดี, บุช, บูชาร์ด, บ็อบ, ปรัสเซีย, ปราโบโว, ปอนด์, ปอมปีย์, ปอล, ปักกิ่ง, ปัลมา, ปานามา, ปาปัวนิวกินี, ปารีส, ปาร์กเกอร์, ปาร์มา, ปินตาโด, ปิเธคูสซี, ปี, ปียาฟ, ปีลาตุส, ปีเตอร์, ปุนตาราซา, ปุนตาเดลเอสเต, ฝรั่งเศส, พระเยซู, พลาซา, พลาโน, พอล, พันวัลคาร์, พาลล์, พาลเมอร์, พาเซอร์รา, พิกกี้, พิรัส, พีบี, พีโอเนีย, พุก, พูล, ฟยอกูร์, ฟยอร์ด, ฟรานซิส, ฟรานซ์, ฟรีแมน, ฟลอริดา, ฟลอริด้า, ฟลอเรนซ์, ฟองต์วิแอล, ฟอน, ฟอร์ซ, ฟอร์ด, ฟอลลอน, ฟาติมา, ฟาสซิสม์, ฟินแลนด์, ฟิลิป, ฟิลิปปินส์, ฟิโอเรลโล, ฟีนิเชียน, ฟีนีเชียน, มลภาวะ, มหาดไทย, มหานคร, มหาอำนาจ, มองโกล, มองโกเลีย, มองโกเลียนอก, มอจเมียร์, มอนติคาร์โล, มอนทรีออล, มอร์ริโคเน, มอร์แกน, มอส, มอสโคนี, มันเดิล, มัลดีฟส์, มัลเลอุส, มาซิโดเนีย, มาดริด, มายา, มาร์, มาร์ก, มาร์กซิสม์, มาร์กาเรต, มาร์กาเร็ต, มาร์ค, มาร์ติน, มาร์ทา, มาร์เซล, มาร์เวล, มาร์โก, มาร์โค, มาเซดอน, มาเร, มาเรนโก, มาโรโต, มิชิม่า, มิลลิคัน, มิลาน, มิลีซ, มิลเดร็ด, มิสซิสซิปปี, มุนโด, ยวน, ยอร์ก, ยาซีดี, ยานนิส, ยาส, ยิว, ยุโรป, ยูกาตัง, ยูนิเวอร์แซล, ยูเครน, ยูเรเชีย, ยูเอ็น, ยูโดโยโน, ยูโรโซน, รถไฟ, รอสซี, รัดยาร์ด, รัสเซีย, ราชนาวี, ราชิดา, ราฟเฟอร์ตี้, ราสทิซ, ราสทิสลาฟ, ราเชล, ริช, ริชาร์ด, ริพับลิกัน, รีพับลิกัน, รูเพิร์ตสเบิร์ก, ร็อคโค่, ลอนดอน, ลอสแอนเจลิส, ละตินอเมริกัน, ลัตซีโย, ลากงต์, ลาบร็อคค่า, ลามาร์, ลาส, ลาสเซอ, ลาฮอร์, ลาเบิฟ, ลินคอล์น, ลินด์เซย์, ลินาเรส, ลิลเลอซันด์, ลี, ลีฟ, ลูคัส, ลูบุมบาชี, ลูปเปอร์, ลูเธอร์, วลาดีวอสตอค, วอชิงตัน, วอลต์, วอลสตรีท, วอลเตอร์, วัตต์, วาชักตุน, วาติกัน, วาเลนติโน, วิกตอเรีย, วิกิเยร์, วินทัวร์, วินสตัน, วินสโตน, วินเทอร์คอร์น, วินแฮม, วิลค์ส, วิลลิส, วิลล์เนิฟ, วิลเลียม, วิลเลียมส์, วีลเลอร์, วูดส์, สกอตแลนด์, สกายลาร์ก, สก็อต, สก็อตส์แมน, สก็อตแลนด์, สตอลเลอร์, สตาร์ลิน, สตาลิน, สตีเฟน, สปริงเกอร์, สปอตติฟาย, สปอติฟาย, สปาร์ตา, สปาร์ต้า, สมาแรกดิส, สมิธ, สลาฟ, สวิตเซอร์แลนด์, สวีเดน, สหราชอาณาจักร, สะฮารา, สัมพันธมิตร, สุเอซ, สุโขทัย, สูติบัตร, สเตอร์ลิง, สเติร์นไลบ์, สเปน, สเลท, สแนปแชท, สแล็ค, สโนว์แมน, สโลวาเกีย, หยวน, หลิน, หลุยส์, หวัง, หัวเว่ย, หูหนาน, หูเป่ย, อธินา, อนายา, อลิซ, ออกุสตุส, ออตโตมัน, ออนทาริโอ, ออร์เตเฟอส์, ออสการ์, ออสบอร์น, ออสวอลด์, ออสเตรีย, ออสเตรเลีย, ออสเตรเลียน, ออสเตอร์ลิตซ์, ออเดรย์, อะคีเมนิด, อะบอริจิน, อะบาคูมอฟ, อะปูเลีย, อะพูเลีย, อะเคีย, อะแลสกา, อังกฤษ, อังเคล, อังเดร, อัดนัน, อันฉือ, อันติปาส, อันเซลมี, อันโตนิโอ, อัฟโร่, อัล, อัลจีเรีย, อัลดริน, อัลบานี, อัลวาเรซ, อาดิดาส, อามิน, อามินทาส, อามูร์รู, อาร์อีซีโอ, อาร์เอชเอส, อาร์เอสซี, อาวน์, อาหรับ, อิซาเบลลา, อิตาลี, อินน์, อินเดีย, อินเดียน, อินเดียนา, อินเดียนแดง, อินโด-ออสเตรเลียน, อินโดนีเซีย, อิสตันบูล, อิสราเอล, อิสลาม, อิสเนอร์, อิหร่าน, อิเอยะสึ, อิแรน, อีก, อีพิสโคปาล, อีฟ, อียิปต์, อีริค, อีอ้อน, อีเกิล, อีเลน, อีแกน, อีไมโคร, อุลริช, อูฟริแยร์, อูเบอร์, อเมริกัน, อเมริกา, อเมริกาเหนือ, อเมริกาใต้, อเลฮันดรา, อเล็กซานเดอร์, อโกรา, ฮวน, ฮอร์ตัน, ฮอลลีวูด, ฮอลสตรอม, ฮังการี, ฮัดสัน, ฮับสบูร์ก, ฮัมฟรีย์, ฮัมเบิลบัมส์, ฮานส์, ฮาริรี, ฮาร์ลีย์, ฮาร์วาร์ด, ฮาลิแฟกซ์, ฮิตช์ค็อก, ฮิตเลอร์, ฮิลลารี, ฮิลลารี่, ฮิลส์โบโร, ฮิวจ์, ฮิสปาเนีย, ฮูซุม, ฮ็อปลีย์, ฮ่องกง, เกซีรา, เกย์, เกรตโมราเวียใหญ่, เกรโค, เกร็นวิลล์, เกล็นด้า, เกาดี, เกาหลีเหนือ, เกาหลีใต้, เกเซอร์, เคชา, เคนทักกี, เคนยา, เคนเซ็ท, เคปทาวน์, เครทช์เมอร์, เคราช์, เคว็น, เคอร์เบอร์, เคียร่า, เคเอฟซี, เจนนิงส์, เจฟฟรี่, เจฟฟ์, เจมส์, เจสซี่, เจสัน, เจอร์รี่, เจอร์แมน, เจอร์แมนิก, เจอโรนิโม, เจ๋อสวี, เฉิน, เชงก์, เชพเพิร์ด, เชอร์ชิล, เชโกสโลวาเกีย, เช็ก, เซซิลี, เซตเทลส์, เซนต์, เซย์, เซย์เชลส์, เซลติก, เซสโต้ซานจิโอวานนี, เซอร์เบีย, เซินเจิ้น, เซี่ยงไฮ้, เซเยี่ยน, เซเรน่า, เด, เดคคา, เดนนีเวิร์ก, เดนมาร์ก, เดนเวอร์, เดลี, เดวิด, เดวิดสัน, เดวิส, เดอ, เดอเมซา, เดโมแครต, เตร, เทนเนสซี, เทล, เทสลา, เทสโก้, เทอร์มอพิลี, เทียนจิน, เทเลคอม, เท็กซัส, เธรซ, เธสซาลี, เนวาดา, เนสทอส, เนเธอร์แลนด์, เน็กทาร์, เบรสเต็ด, เบรเมน, เบร็กซิต, เบลลิงส์เฮาเซน, เบลลิงแฮม, เบลเกรด, เบลเยียม, เบส, เบอนัวต์, เบอร์กอยน์, เบอร์นาด, เบอร์ลิน, เบอร์เกรอน, เบเรีย, เบเวอร์ลีฮิลส์, เปตราสซี, เปลุกก้า, เปอร์เชีย, เปอร์เซีย, เปอร์โตริโก, เปาโล, เปียงยาง, เปี้ยน, เปเต็น, เปโดร, เพนิสตัน, เพลโต, เพโลพอนนีส, เพ็ทเตอร์สัน, เฟซบุ๊ก, เฟลนส์บวร์ก, เฟลลินี, เฟลิเป, เฟสบุ๊ค, เฟเดริโก, เมกาบาซุส, เมกาเรียน, เมจิ, เมดิเตอร์เรเนียน, เมท, เมย์, เมลลิส, เมลานีเซีย, เมลาเนีย, เมสซาเนีย, เมสตา, เมอร์ดิงเงิน, เมอร์ฟี, เมอันเกียลี, เมาเทนวิว, เมเยอร์, เมโสอเมริกัน, เม็กซิกัน, เม็กซิโก, เยซู, เยรูซาเลม, เยร์บาบวยนา, เยอรมนี, เยอรมัน, เยียร์, เยเมน, เรดดิท, เรอมิส, เรแกน, เลนนี่, เลนน็อกซ์, เลิฟวิง, เวก้า, เวนิส, เวลส์, เวลเลอร์, เวสต์อินดีส, เวือร์ทเทมแบร์ก, เหนือ, เหลียว, เหลี่ยม, เอช, เอดินบะระ, เอนดูรานซ์, เอนนิโอ, เอนริเก, เอพี, เอร์โดอาน, เอล, เอลเลียต, เอสเซน, เอสเอส, เออร์รานี, เออร์เนสต์, เออร์โดกัน, เอากุสตุส, เอิตซี, เอิร์ล, เอเชีย, เอเชียตะวันออกเฉียงใต้, เอเชียใต้, เอเดรียติก, เอเธนส์, เอเวอรี่, เอ็กซอนโมบิล, เอ็ดการ์, เอ็ดเวิร์ด, เอ็นเอชเอส, เอ็มจีบี, เฮคเลอร์, เฮนรี่, เฮปเบิร์น, เฮอร์เซิล, เฮอร์เบิร์ต, เฮเลน่า, เฮโรด, เฮโรเดียส, แกมสัน, แคทเธอรีน, แคนซัส, แคนาดา, แคปิตอลฮิล, แคปแลน, แคมบริดจ์เชอร์, แคมป์เบลล์, แคริบเบียน, แคเมอรูน, แคเมอรูนใต้, แชคเคิลตัน, แชนด์เลอร์, แชมเบอร์เลน, แชเปิลฮิลล์, แซงต์, แซงต์-โกดองส์, แซลลีแอนน์, แทนซาเนีย, แนชวิลล์, แบรนต์, แบรนส์ฟิลด์, แบร์รี่, แปซิฟิก, แปร์, แพคแฮม, แพพเวิร์ท, แพลนแทเจเน็ต, แฟรงค์, แมคเกรเกอร์, แมคเนลลี่, แมนจู, แมสส์บอต, แรมเบลอร์, แรมโบ้, แรเมซีส, แลร์รี, แวนซ์, แวร์ซาย, แองกลิกัน, แองเจิล, แอดเดนบรูค, แอตกินสัน, แอตแลนติก, แอนดรูว์, แอนดีส, แอนดีสเดติโปอันดิโน, แอนดี้, แอนตาร์กติก, แอนตาร์กติกา, แอนทิลลิส, แอนน์, แอบบอทส์ฟอร์ด, แอปเปิล, แอฟริกัน, แอฟริกา, แอฟริกาตะวันออก, แอฟริกาใต้, แอมะซอน, แอลป์, แอลเบเนีย, แอสตี้, แฮมเมอร์สมิธ, แฮ็ค, โกฟเฟรโด, โกล, โกลด์, โกเมอรี่, โคมีย์, โครยอ, โคริ, โครินธ์, โคลัมบัส, โคโรนา, โคโลญจ์, โคโลราโด, โจ, โจน, โจเซฟ, โจโควี, โชวะ, โซนี่, โซลไฮม์, โดนัลด์, โดมินิกัน, โดเมนิโค, โทคุงาว่า, โทมัส, โทรอนโต, โนมาอินฟิล, โบกด์, โบการ์ท, โบนาปาร์ต, โบห์เมอร์, โบอิ้ง, โบโน, โป, โปรตุเกส, โปรเตสแตนต์, โปลิตตี, โปแลนด์, โปโตแมค, โพสต์, โฟล์คสวาเกน, โมนาโก, โมราเวีย, โมร็อคโค, โมลีเซ, โมฮัมเหม็ด, โมโมน, โยเซฟ, โยเลียต-กูรี, โรนา, โรบินสัน, โรม, โรมัน, โรมานอฟ, โรมานี, โรมาเนีย, โรมิโอ, โรม่า, โรห์น, โรเจอร์ส, โรแซน, โลก, โลรองต์, โลเวอร์ออสเตรีย, โวลมาร์, โอดี้, โอต์-การอนน์, โอบามา, โอลนีย์, โอลิมปิก, โอลิเวีย, โอเดสซาโอบลาสต์, โอเบอร์มาร์สเบิร์ก, โอเปียม, โอไฮโอ, โฮลเด็น, โฮเมอร์, ไครเมีย, ไคลด์, ไคลน์, ไคโร, ไซต์, ไซบีเรีย, ไซมอน, ไซเธีย, ไทย, ไนตรา, ไนท์ลีย์, ไนล์, ไบเบิล, ไบแซนเทียม, ไพรซ์, ไมซีเนียน, ไมอามี, ไมเคิล, ไมโครซอฟต์, ไมโอรัม, ไรท์, ไรน์, ไรย์, ไรอัน, ไรเคนบาค, ไลน์, ไลเว็ต, ไวส์, ไอซ์แลนด์, ไอบิงเงิน, ไอริช, ไอร์แลนด์เหนือ, ไฮน์ริช.

PROPN occurs with 1 features: Typo (4; 0% instances)

PROPN occurs with 1 feature-value pairs: Typo=Yes

PROPN occurs with 2 feature combinations. The most frequent feature combination is _ (1487 tokens). Examples: จีน, ยุโรป, อังกฤษ, อเมริกา, ฝรั่งเศส, สเปน, ทรัมป์, รัสเซีย, ออสเตรเลีย, อเมริกัน

Relations

PROPN nodes are attached to their parents using 18 different relations: flat:name (357; 24% instances), compound (240; 16% instances), nsubj (235; 16% instances), obl (160; 11% instances), nmod:poss (118; 8% instances), appos (90; 6% instances), nmod (81; 5% instances), conj (77; 5% instances), obj (75; 5% instances), obl:poss (23; 2% instances), nsubj:pass (14; 1% instances), clf (5; 0% instances), xcomp (5; 0% instances), ccomp (3; 0% instances), root (3; 0% instances), acl:relcl (2; 0% instances), obl:tmod (2; 0% instances), acl (1; 0% instances)

Parents of PROPN nodes belong to 8 different parts of speech: NOUN (762; 51% instances), VERB (500; 34% instances), PROPN (214; 14% instances), PRON (5; 0% instances), ADJ (3; 0% instances), ADV (3; 0% instances), (3; 0% instances), NUM (1; 0% instances)

852 (57%) PROPN nodes are leaves.

425 (29%) PROPN nodes have one child.

145 (10%) PROPN nodes have two children.

69 (5%) PROPN nodes have three or more children.

The highest child degree of a PROPN node is 7.

Children of PROPN nodes are attached using 26 different relations: case (382; 40% instances), flat:name (173; 18% instances), conj (72; 8% instances), appos (64; 7% instances), cc (63; 7% instances), punct (48; 5% instances), acl:relcl (28; 3% instances), compound (25; 3% instances), nmod (17; 2% instances), cop (14; 1% instances), amod (11; 1% instances), acl (7; 1% instances), det (7; 1% instances), nsubj (7; 1% instances), nummod (6; 1% instances), obl:tmod (6; 1% instances), goeswith (4; 0% instances), nmod:poss (4; 0% instances), advmod (3; 0% instances), clf (3; 0% instances), mark (3; 0% instances), aux (2; 0% instances), cc:preconj (2; 0% instances), dep (2; 0% instances), discourse (1; 0% instances), xcomp (1; 0% instances)

Children of PROPN nodes belong to 15 different parts of speech: ADP (380; 40% instances), PROPN (214; 22% instances), NOUN (155; 16% instances), CCONJ (62; 6% instances), PUNCT (48; 5% instances), VERB (36; 4% instances), AUX (16; 2% instances), ADJ (12; 1% instances), DET (9; 1% instances), NUM (9; 1% instances), PRON (4; 0% instances), X (4; 0% instances), SYM (3; 0% instances), ADV (2; 0% instances), PART (1; 0% instances)