UD Kangri KDTB
Language: Kangri (code: xnr
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.8 release.
The following people have contributed to making this treebank part of UD: Shweta Chauhan, Shefali Saxena, Apoorva Jha, Philemon Daniel.
Repository: UD_Kangri-KDTB
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: nonfiction, news
Questions, comments? General annotation questions (either Kangri-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [shweta (æt) nith • ac • in , shefali (æt) nith • ac • in, apoorva • jha (æt) gmail • com , phildani7 (æt) nith • ac • in]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | assigned by a program, not checked manually |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | assigned by a program, not checked manually |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Kangri UD Treebank (KDTB) is a part of the Universal Dependency treebank project.
The Kangri UD Treebank (KDTB) consists of 2,249 tokens and 1108 vocabulary (288 sentences). This Treebank is a part of the Universal Dependency treebank project. Himachal Academy of Arts Culture and Languages, Shimla, Himachal Pradesh, India helped in providing annotators for universal dependency tagging. KDTB data contains syntactic annotation according to dependency-constituency schema, as well as morphological tags. In this data, XPOS is annotated according to Bureau of Indian Standards (BIS) Part of Speech (POS) tagset.
Acknowledgments
- Mr. Bhupender Bhupi
- Dr. Rajeev Kumar Trigarti
References
- (citation)
Statistics of UD Kangri KDTB
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
AdpType – Aspect – Case – Echo – Foreign – Gender – Mood – Number – NumType – Person – Polarity – Polite – Poss – PronType – Tense – VerbForm – Voice
Relations
advcl – advmod – amod – aux – aux:pass – case – cc – ccomp – compound – conj – cop – dep – det – discourse – flat – iobj – mark – nmod – nsubj – nummod – obj – obl – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 288 sentences and 2514 tokens.
- This corpus contains 288 tokens (11%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus does not contain words that contain both letters and punctuation.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: SYM, X
- This corpus contains 15 word types tagged as particles (PART): ऊञा, कदेया, कैह्जो, क्या, चल, ता, तां, न, नी, प्रति, भर, भी, मत, लगभग, ही
- This corpus contains 54 lemmas tagged as pronouns (PRON): अपणा, अपणी, अप्पू, असां, आप, इत्थू, इसजो, इसदा, इसदी, एह, कर, किछ, कुछ, कुथी, कुब्जा, कुसी, कैस, क्या, जे, जेह्ड़ा, तिजो, तिज्जो, तित्थू, तिन्ना, तिन्नी, तिस, तिसजो, तिसदा, तिसदिया, तिसदी, तिसा, तिह्नां, तिह्नांदी, तुफान, तुसाँ, तुसां, तू, तूं, तेरिया, तैं, पंजाब, माधो, मिंजो, मिंज्जो, मेरिया, मैं, म्हारा, यह, सब, सै, सैह, सैह्, स्हाड़िया, हुण
- This corpus contains 25 lemmas tagged as determiners (DET): इक्को, इतणा, इत्थू, इह्नां, एह, एह्, कितणा, कुल, केई, कोई, घट्ट, जरा, जादा, तिन्ना, तिन्नी, तिह्नां, दोयो, मत, मति, मते, यह, सारा, सारेय, सैह, हर
- Out of the above, 7 lemmas occurred sometimes as PRON and sometimes as DET: इत्थू, एह, तिन्ना, तिन्नी, तिह्नां, यह, सैह
- This corpus contains 8 lemmas tagged as auxiliaries (AUX): करणा, चाहिदा, जाणा, था, पेणा, रेहणा, सकणा, है
- Out of the above, 5 lemmas occurred sometimes as AUX and sometimes as VERB: करणा, जाणा, था, रेहणा, है
- There are 4 (de)verbal forms:
- Conv
- VERB: करदे
- Fin
- AUX: है, था, हन, थी, थे, सकदे, हैं, कढदे, करदे, गै
- VERB: लग्गा, लैह्ंगी, है, औणे, करगे, खांहगे, चलणा, चुणेया, तोड़े, थी
- Inf
- AUX: करना
- VERB: करना, जाणा, पढ़ने, बचाणे, रखणे, होणे, करदे, करनी, करने, खुआणे
- Part
- AUX: गेया, गेई, करदा, करदी, चाहिदा, रेह्या, सकदा, कित्ता, गेइयो, चाहिदी
- VERB: होई, करी, दित्ती, दित्ता, लगी, दा, दी, आई, आया, होया
Nominal Features
- Fem
- ADJ: बड़ी, केइयां, नीली, बड्डी, अधिष्ठात्री, अपणी, अपणेयां, उच्ची, काली, काळेयां
- AUX: गेई, थी, करदी, चाहिदी, पेई, कित्ता, गई, जा, जाणी, पोंदी
- AUX-Fin: थी
- AUX-Part: गेई, करदी, चाहिदी, पेई, गई, जाणी, पोंदी, रेही, रेह्यी, सकदी
- DET: इतणा, केइयाँ, मतियाँ, सारेयां
- NOUN: लोकां, अम्मा, माता, ग्रांएं, जरूरत, ज़रूरत, सलाह, हवा, कताब, किताब
- NUM: इक, त्रींह, त्रीह्नी, पैंती
- PRON: सैह, तिसदी, तिह्नां, इसदा, इसदी, किछ, तिन्नी, मेरी, अपणियां, अपणी
- PROPN: दुर्गा, रामें, कांगड़ें, चौधरिएं, ज़मीन, धन्नुए, बज्रेश्वरी, ब्रजेश्वरिया, मीना, योजना
- VERB: होई, करी, दित्ती, लगी, कित्ती, दी, आई, हुन्दी, ओंदी, खुल्ली
- VERB-Fin: लैह्ंगी, थी, लग्गी, हुंगी
- VERB-Inf: करनी
- VERB-Part: होई, करी, दित्ती, लगी, दी, आई, कित्ती, खुल्ली, चली, निकळी
- Masc
- ADJ: खरे, छैळ, अगले, अपणा, पक्का, पहला, बड़ा, बड्डा, मता, वाळे
- AUX: गेया, था, करदा, थे, गे, गेइयो, चाहिदा, रेह्या, सकदा, कित्ता
- AUX-Fin: था, थे, हन
- AUX-Part: गेया, करदा, चाहिदा, रेह्या, सकदा, कित्ता, गेइयो, गिया, गे, गेयो
- DET: एह, मते, इक्को, इसा, इह्नां, एह्, तिन्ना, दोयो, सारे, सैह
- NOUN: घरे, कमरे, मन्दरे, घर, पता, पाणिए, प्रतिशत, फायदा, बजे, बरखा
- NUM: इक्क, दोयो, पंज, सत
- PRON: मिंजो, सैह, तिसजो, तिसा, असां, एह, तुसां, मेरिया, म्हारे, अपणे
- PROPN: कांगड़े, अमेरिका, धर्मशाला, राजकुमार, राजुए, अमरीका, इंगलैण्ड, कटोचां, कन्हैया, काळुए
- VERB: दित्ता, दा, आया, करदे, हुन्दा, हुन्दे, होया, ओआ, करना, पीन्दा
- VERB-Fin: लग्गा, करगे, खांहगे, चुणेया, थे, पहनेया, भुलगा, रैहंगा, लैंह्गा, लैणा
- VERB-Inf: करना, करदे, जाणा, मिलणा, हुन्दे, होणे
- VERB-Part: दित्ता, दा, आया, होया, समझा, होई, आयो, उठदा, उडाया, करदा
- Plur
- ADJ: खरे, केइयां, नौइयां, लाहदियाँ, सारे, अगले, अगलेयां, अपणेयां, काळेयां, चौंही
- AUX: थे, गे, हन, जांदे, रैंहदे, हैं
- AUX-Fin: थे, हन, हैं
- AUX-Part: गे, जांदे
- DET: इन्हां, केइयाँ, तिह्नां, मतियाँ, मते, सारे, सारेयां
- NOUN: लोकां, कमरे, ग्रांएं, रूपेइये, त्रासदियां, बच्चेयां, सालां, ओढणां, कण्डें, कथां
- PRON: तिह्नां, म्हारे, अपणियां, जेह्ड़े, तुफानें, सब
- PROPN: रामें, कटोचां, चौधरिएं, दूलो, मितुए, राजुए, वीरवारे
- VERB: हुन्दे, उठदे, औह्न, खांहगे, खुआए, थे, दसगे, दिंदे, दित्ते, दे
- VERB-Fin: खांहगे, थे, दिंदे, हन, हुन्दे
- VERB-Inf: हुन्दे
- VERB-Part: उठदे, खुआए, दित्ते, बणेओ, भरदे, रखदे, लगी, हुन्दे, होए
- Sing
- ADJ: छैळ, बड़ी, मता, अपणा, नीली, पक्का, पहला, बड़ा, बड्डा, बड्डी
- AUX: है, गेया, था, हन, गेई, थी, करदा, करदी, कित्ता, गेइयो
- AUX-Fin: है, था, हन, थी, सकदे, करदे, गै, जाएं, थियां, थे
- AUX-Part: गेया, गेई, करदा, करदी, चाहिदा, रेह्या, सकदा, कित्ता, गेइयो, चाहिदी
- DET: कोई, इस, इसा, एह, इक्को, इतणा, इह्नां, एह्, तिन्ना, दोयो
- NOUN: घरे, अम्मा, मन्दरे, माता, कताब, गल्ल, घर, जरूरत, ज़रूरत, डर
- NUM: इक्क, 15, 8, इक, त्रींह, त्रीह्नी, दोयो, पंज, पैंती, सत
- PRON: सैह, मैं, मिंजो, इसते, तिन्नी, तिसा, इसदे, तिस, तिसजो, तिसदी
- PROPN: कांगड़े, अमेरिका, दुर्गा, धर्मशाला, राजकुमार, शर्मा, 2020, अमरीका, इंगलैण्ड, कन्हैया
- VERB: होई, करी, दित्ती, दित्ता, कित्ती, दा, दी, लगी, आई, आया
- VERB-Fin: लग्गा, लैह्ंगी, है, औणे, करगे, चलणा, चुणेया, तोड़े, थी, दियां
- VERB-Inf: करना, रखणे, करनी, करने, चलणे, चलाणा, जाणा, डरने, बचाणे, मिलणा
- VERB-Part: होई, करी, दित्ती, दित्ता, दा, दी, लगी, आई, आया, होया
- Acc
- ADJ: अगले, वाळे, अगलेयां, उच्चे, काळे, खरे
- DET: इस, इसा, इन्हां
- NOUN: पाणिए, सालां, आप्पे, कम्पनिया, खूह्आं, गौरा, घड़े, जगह, टियाळे, डॉक्टर
- PRON: इस, तिज्जो, तिस, तिसा, तुसां, म्हारे
- PROPN: अमेरिका, कटोचां, कृष्णे, गरीबुए, डोगरे, पालमपुरे, मोहने, शर्मा, सतलुजा
- VERB: गलाई, पढ़ने, बचाणे, रखणे, सुणी, होणे, करने, करी, खुआणे, चलणे
- VERB-Inf: पढ़ने, बचाणे, रखणे, होणे, करने, खुआणे, चलणे, डरने, मिलणे
- Acc,Dat
- DET: इन्हां, इसा
- PRON: इसा
- Acc,Gen
- PRON: इसदी, इसदे, मेरा, मेरी, मेरे, इसते
- Acc,Ins
- PRON: इसते, इसदे, तिसते
- Nom
- ADJ: खरे, घट्ट, छैळ, देह्या, बड़ी, मता, अपणा, अपणें, असली, कमज़ोर
- AUX: गे, करना, कित्ता, गेइयो, पेया, रैह्न्दी
- AUX-Inf: करना
- DET: कोई, एह, घट्ट, इत्थू, तिन्नी, इक्को, इतणा, इसा, इह्नां, एह्
- NOUN: लोकां, गल्ल, घरे, अम्मा, कमरे, मन्दरे, माता, कताब, ग्रांएं, घर
- NUM: इक्क, इक्की, 15, 8, इक, त्रींह, त्रीह्नी, दोयो, पंज, पैंती
- PRON: सैह, मैं, मिंजो, तिन्नी, तुसां, असां, तिह्नां, तिसजो, तिसदी, तिसा
- PROPN: कांगड़े, दुर्गा, धर्मशाला, राजकुमार, राजुए, रामें, 2020, अमरीका, इंगलैण्ड, कन्हैया
- VERB: हुन्दा, हुन्दी, ओंदी, ओआ, कित्ती, गुआन्दे, दस्सेया, दिक्खा, दित्तियो, देणा
- VERB-Inf: जाणा, देणा, पकड़ना, लैणा, होणा
Degree and Polarity
- Neg
- ADV: नी
- PART: नी, न, मत
Verbal Features
- Imp
- AUX-Part: करदा, करदी, सकदा, कित्ता
- VERB-Part: दित्ती, दित्ता, जांदा, दित्ते, पीता, बोलेया, समझदे
- Perf
- AUX-Part: गेया, गेई, चाहिदा, रेह्या, गेइयो, चाहिदी, पेई, करदा, करदी, कित्ता
- VERB-Part: होई, करी, लगी, दा, दी, आई, आया, होया, कित्ती, खुल्ली
- Ind
- AUX-Fin: है, था, हन, थी, थे, हैं, गै
- VERB-Fin: लग्गा, लैह्ंगी, है, करगे, खांहगे, चुणेया, थी, थे, पहनेया, भुलगा
- Sub
- AUX-Fin: सकदे, कढदे, करदे, जाएं, थियां, हन्
- VERB-Fin: औणे, चलणा, तोड़े, दिंदे, दियां, दुआएं, लेई, लेयां, हुणीं
- Fut
- VERB-Fin: लग्गा, लैह्ंगी, करगे, खांहगे, चुणेया, पहनेया, भुलगा, रैहंगा, लग्गी, लैंह्गा
- Past
- AUX-Fin: था, थी, थे, हन
- VERB-Fin: थी, थे
- Pres
- AUX-Fin: है, हन, हैं, गै
- VERB-Fin: है, हन
- Act
- AUX: है, हन, था, थी, थे, चाहिदा, रेह्या, करदा, कित्ता, गेया
- AUX-Fin: है, हन, था, थी, थे, कढदे, करदे, गै, जाएं, थियां
- AUX-Part: चाहिदा, रेह्या, करदा, कित्ता, गेया, चाहिदी, करदी, गेइयो, जांदे, पोंदी
- VERB: होई, दित्ती, करी, लगी, आई, आया, हुन्दे, होया, करना, करा
- VERB-Fin: लग्गा, लैह्ंगी, औणे, करगे, खांहगे, चलणा, चुणेया, तोड़े, थी, दिंदे
- VERB-Inf: करना, करदे, करनी, चलाणा, जाणा, मिलणा, हुन्दे
- VERB-Part: होई, दित्ती, करी, लगी, आई, आया, होया, कित्ती, खुल्ली, चली
- Pass
- VERB-Part: चला, छड्डेया, होई
Pronouns, Determiners, Quantifiers
- Dem
- DET: इस, इसा, इन्हां
- PRON: तिस, इसा, इस
- Ind
- DET: हर, कुल
- Int
- ADV: कजो, कदी, काह्लू, कैंह्
- DET: कितणे
- PART: क्या, कदेया
- PRON: तुसां, कैस, कुसी, क्या
- Neg
- ADV: नी
- Prs
- DET: कोई, इसा, इन्हां
- PRON: मैं, तुसां, इसते, असां, अपणे, इसदे, इस, इसदी, तिसा, मेरा
- Card
- DET: एह, तिह्नां
- NUM: दो, चौंह, दोयो, 19, 25, 250, 300, 35000, 40, 5
- PRON: सैह, एह, तिसा
- Ord
- ADJ: दूई, पहला
- Yes
- PRON: इसदी, इसदे, मेरा, मेरी, मेरे, इसते
- 1
- PRON: मैं, मेरा, मेरी, मेरे
- VERB-Fin: खांहगे
- VERB-Part: जांदा
- 2
- AUX-Fin: करदे, जाएं, थियां, सकदे, हन्
- PRON: आप
- VERB: औणे, करा, चलणा, जाई, दियां, दुआएं, लेई, लेयां, हुणीं
- VERB-Fin: औणे, चलणा, दियां, दुआएं, लेई, लेयां, हुणीं
- 3
- ADJ: छैळ, मता, अपणा, केइयां, पक्का, लाहदियाँ, अधिष्ठात्री, अपणी, अपणेयां, कदेह
- AUX: है, हन, गे, गेइयो, जा, हैं, करदा, करदी, कित्ता, गेया
- AUX-Fin: है, हन, हैं, गै, थे, सकदे
- AUX-Part: करदा, करदी, गेइयो, गेया, हन
- DET: कोई, इस, इसा, एह, इन्हां, इक्को, इतणा, इह्नां, एह्, केइयाँ
- NOUN: गल्ल, घरे, लोकां, बरखा, अम्मा, कमरे, कम्म, कवता, खाणा, मन्दरे
- NUM: इक्क, 15, 8, इक, त्रींह, त्रीह्नी, दोयो, पंज, पैंती, सत
- PRON: सैह, मिंजो, इसते, तिन्नी, तिह्नां, इसदे, तिस, तिसजो, तिसा, इस
- PROPN: कांगड़े, अमेरिका, दुर्गा, धर्मशाला, बी, राजकुमार, राजुए, रामें, शर्मा, 2020
- VERB: होई, हुन्दा, हुन्दी, ओंदी, ओआ, करदे, कित्ती, गलाई, दस्सेया, दिक्खा
- VERB-Fin: लग्गा, लैह्ंगी, है, करगे, चुणेया, तोड़े, दिंदे, पहनेया, भुलगा, रैहंगा
- VERB-Inf: करनी, चलाणा, जाणा, बचाणे, मिलणा, हुन्दे
- VERB-Part: होई, आई, उठदा, उठदे, करदी, करदे, करा, गए, गेईयो, चला
- Form
- AUX-Fin: हन, करदे, जाएं, थियां, थे, सकदे, हन्, हैं
- AUX-Part: हन
- PRON: आप, तैं
- VERB: लैह्ंगी, औणे, करगे, करदे, करा, गए, चलणा, जाई, दियां, दुआएं
- VERB-Fin: लैह्ंगी, औणे, करगे, चलणा, दियां, दुआएं, लेई, लेयां, हुणीं
- VERB-Part: करदे, गए, भुलदे, समझदे
Other Features
- AdpType
- Post
- ADP: विच, जो, दा, दी, ते, दे, ने, के, पर, कने
- Post
- Echo
- Rdp
- ADJ: खरे
- NOUN: दर, मने
- Rdp
- Foreign
- Yes
- ADJ: पास
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: है, था.
- This corpus uses 8 lemmas as auxiliaries (aux). Examples: जाणा, है, करणा, था, रेहणा, पेणा, सकणा, चाहिदा.
- This corpus uses 5 lemmas as passive auxiliaries (aux:pass). Examples: है, था, करणा, जाणा, चाहिदा.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (3)
- VERB--NOUN-Nom (20)
- VERB--PRON (6)
- VERB--PRON-Nom (19)
- VERB-Conv--PRON (1)
- VERB-Fin--NOUN-Nom (6)
- VERB-Fin--PRON (3)
- VERB-Fin--PRON-Nom (10)
- VERB-Inf--NOUN-Nom (3)
- VERB-Inf--NOUN-Nom-ADP(जो) (1)
- VERB-Inf--PRON (2)
- VERB-Inf--PRON-ADP(जो) (1)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN (2)
- VERB-Part--NOUN-Acc (2)
- VERB-Part--NOUN-Nom (34)
- VERB-Part--NOUN-Nom-ADP(जो) (2)
- VERB-Part--PRON (10)
- VERB-Part--PRON-Nom (22)
- VERB-Part--PRON-Nom-ADP(जो) (1)
- obj
- VERB--NOUN (2)
- VERB--NOUN-Acc-ADP(ने) (1)
- VERB--NOUN-Nom (19)
- VERB--NOUN-Nom-ADP(जो) (3)
- VERB--PRON (1)
- VERB--PRON-Nom (3)
- VERB-Conv--NOUN (1)
- VERB-Fin--NOUN-Nom (5)
- VERB-Fin--NOUN-Nom-ADP(जो) (1)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--NOUN-Nom-ADP(कन) (1)
- VERB-Inf--NOUN-Nom-ADP(दे) (1)
- VERB-Inf--PRON (1)
- VERB-Part--NOUN (1)
- VERB-Part--NOUN-Acc-ADP(ने) (1)
- VERB-Part--NOUN-Acc-ADP(पास्स) (1)
- VERB-Part--NOUN-Nom (25)
- VERB-Part--NOUN-Nom-ADP(जो) (1)
- VERB-Part--NOUN-Nom-ADP(दे) (1)
- VERB-Part--PRON (1)
- VERB-Part--PRON-Nom (2)
- VERB-Part--PRON-Nom-ADP(जो) (1)
- iobj
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--PRON-Nom (1)
- VERB-Part--PRON-Nom-ADP(जो) (1)