home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Thai-PUD: POS Tags: ADP

There are 1 ADP lemmas (6%), 66 ADP types (2%) and 3134 ADP tokens (14%). Out of 16 observed tags, the rank of ADP is: 2 in number of lemmas, 7 in number of types and 3 in number of tokens.

The 10 most frequent ADP lemmas: _

The 10 most frequent ADP types: ใน, ของ, ว่า, จาก, กับ, ที่, โดย, ถึง, เมื่อ, ทาง

The 10 most frequent ambiguous lemmas: _ (NOUN 6052, VERB 4361, ADP 3134, PROPN 1491, AUX 1449, DET 1026, ADJ 969, ADV 951, PRON 683, PART 608, CCONJ 606, NUM 581, PUNCT 272, SYM 134, X 4, SCONJ 1)

The 10 most frequent ambiguous types: ใน (ADP 682, ADJ 4, CCONJ 3, NOUN 2), ของ (ADP 488, NOUN 4), ว่า (ADP 231, VERB 23), จาก (ADP 222, CCONJ 4), กับ (ADP 196, CCONJ 21, NOUN 1), ที่ (DET 495, ADP 126, NOUN 102, PRON 30), ถึง (ADP 95, ADV 8, CCONJ 2, VERB 2), เมื่อ (ADP 91, NOUN 2), ทาง (ADP 72, NOUN 22), ด้วย (ADP 63, ADV 33)

Morphology

The form / lemma ratio of ADP is 66.000000 (the average of all parts of speech is 269.375000).

The 1st highest number of forms (66) was observed with the lemma “_”: If, กระทั่ง, กระนั้น, กลาง, กว่า, กับ, การจากลา, ก่อน, ของ, จน, จวบจน, จาก, จึง, ซึ่ง, ฐาน, ณ, ด้วย, ตรง, ตลอด, ตอน, ตั้ง, ตาม, ต่อ, ถึง, ถ้า, ทั้ง, ทาง, ที่, ท่ามกลาง, นอก, บน, ผ่าน, ยัง, รอบ, ระหว่าง, ริม, ว่า, สำหรับ, สู่, หน้า, หลัง, หาก, อย่าง, ออน, ออฟ, อัน, อาทิ, อิน, เชิง, เช่น, เนื่อง, เพราะ, เพื่อ, เมื่อ, เหนือ, แก่, แต่, แม้, แล้ว, แห่ง, โดย, โอเวอร์, ใกล้, ใจกลาง, ใต้, ใน.

ADP does not occur with any features.

Relations

ADP nodes are attached to their parents using 10 different relations: case (2343; 75% instances), mark (547; 17% instances), fixed (221; 7% instances), cc (14; 0% instances), cc:preconj (4; 0% instances), advcl (1; 0% instances), advmod (1; 0% instances), appos (1; 0% instances), csubj (1; 0% instances), obl (1; 0% instances)

Parents of ADP nodes belong to 13 different parts of speech: NOUN (1583; 51% instances), VERB (820; 26% instances), PROPN (380; 12% instances), PRON (143; 5% instances), ADP (117; 4% instances), ADJ (46; 1% instances), ADV (13; 0% instances), CCONJ (11; 0% instances), NUM (11; 0% instances), PART (7; 0% instances), AUX (1; 0% instances), DET (1; 0% instances), SYM (1; 0% instances)

2999 (96%) ADP nodes are leaves.

104 (3%) ADP nodes have one child.

16 (1%) ADP nodes have two children.

15 (0%) ADP nodes have three or more children.

The highest child degree of a ADP node is 7.

Children of ADP nodes are attached using 10 different relations: fixed (171; 92% instances), advmod (3; 2% instances), punct (3; 2% instances), obj (2; 1% instances), amod (1; 1% instances), case (1; 1% instances), cop (1; 1% instances), mark (1; 1% instances), nsubj (1; 1% instances), obl:tmod (1; 1% instances)

Children of ADP nodes belong to 11 different parts of speech: ADP (117; 63% instances), ADV (39; 21% instances), ADJ (9; 5% instances), NOUN (6; 3% instances), PART (4; 2% instances), PRON (3; 2% instances), PUNCT (3; 2% instances), AUX (1; 1% instances), CCONJ (1; 1% instances), DET (1; 1% instances), NUM (1; 1% instances)