UD Georgian GLC
Language: Georgian (code: ka
)
Family: Kartvelian
This treebank has been part of Universal Dependencies since the UD v2.13 release.
The following people have contributed to making this treebank part of UD: Irina Lobzhanidze.
Repository: UD_Georgian-GLC
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: fiction, nonfiction
Questions, comments? General annotation questions (either Georgian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [irina_lobzhanidze (æt) iliauni • edu • ge]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | assigned by a program, not checked manually |
UPOS | assigned by a program, with some manual corrections, but not a full manual verification |
XPOS | assigned by a program, not checked manually |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | assigned by a program, with some manual corrections, but not a full manual verification |
Description
The Georgian UD Treebank (UD_Georgian-GLC) is the first syntactically annotated corpus of Georgian, based on a collection of annotated sentences selected from the Georgian Language Corpus (GLC) available at http://corpora.iliauni.edu.ge/ and sentences selected from Wiki in accordance with the 132 scientific fields.
The Georgian UD Treebank (UD_Georgian-GLC) serves as the first syntactically annotated corpus of the Georgian language. It includes 151 utterances randomly selected from the GLC (Doborjginidze et al. 2013), providing detailed annotations encompassing the grammatical structure and dependencies within the sentences.
The treebank’s annotations align with the Universal Dependencies (UD) specifications, allowing for greater consistency and compatibility with other UD treebanks. Although the tokenization and segmentation principles of the GLC differ slightly from those of the UD, the UD_Georgian-GLC follows the UD approach, particularly regarding multiword tokens, to minimize differences.
Morpho-syntactic annotations, as discussed in Lobzhanidze (2022), have been automatically adapted to UD requirements. This includes annotations for lemmas (LEMMA), part-of-speech categories (UPOS; XPOS), morphological features (FEATS), transliteration, and tokenization issues (MISC). Furthermore, heads of words (HEADS), dependency relations (DEPREL), and enhanced dependency graphs (DEPS) were automatically converted and then reviewed and manually corrected.
The current version of the UD_Georgian-GLC treebank includes 151 utterances (sentences) or 2123 tokens and 3013 sentences or 44030 tokens from Wikipedia arranged in accordance with the 131 scientific domains. These sentences served as a training set, enriching the treebank and offering a more comprehensive representation of the Georgian language. The primary objective is to provide a more comprehensive and representative dataset for training and analysis purposes.
Acknowledgments
The UD_Georgian-GLC release is based on the data from the Georgian Language Corpus (GLC) developed with the financial support of the Shota Rustaveli National Science Foundation (Project Nos. DP2016_23, LE/17/1-30/13, AR/320/4-105/11, Y-04-10).
Special gratitudes goes to Prof. Dr. Stavros Skopeteas from the University of Göttingen for his support and valuable comments on the initial data of the UD_Georgian-GLC treebank, Prof. Dr. Benjamin Roth from the University of Vienna for his feedback concerning the training dataset of the UD_Georgian-GLC treebank and to Prof. Dr. Dan Zeman for his invaluable contributions in making the dataset available on GitHub and offering valuable suggestions.
References
Doborjginidze, N., Lobzhanidze, I., Gunia, I. (2012). Georgian language corpus. See, http://corpora.iliauni.edu.ge/. Accessed 15 July 2023.
Doborjginidze, N., Lobzhanidze, I., Mirianashvili, G. (2014). Corpus of Georgian Chronicles. See, http://corpora.iliauni.edu.ge/. Accessed 15 July 2023.
Lobzhanidze, I. (2022). Finite-State Computational Morphology: An Analyzer and Generator for Georgian. Cham: Springer.
Statistics of UD Georgian GLC
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – AdvType – Animacy – Aspect – Case – Degree – Evident – Foreign – Mood – NameType – Number – Number[io] – Number[obj] – Number[subj] – NumForm – NumType – PartType – Person – Person[io] – Person[obj] – Person[subj] – Poss – PronType – PunctType – Subcat – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – advmod:lmod – amod – appos – aux – case – cc – ccomp – compound – conj – cop – csubj – dep – det – det:poss – discourse – expl – fixed – flat – flat:foreign – flat:name – iobj – mark – nmod – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:tmod – orphan – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 3164 sentences, 56174 tokens and 60173 syntactic words.
- This corpus contains 9789 tokens (17%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 473 types of words that contain both letters and punctuation. Examples: ბერძნ., ერთ-ერთი, სასოფლო-სამეურნეო, ძვ., ინგლ., ლათ., მაგ., ე.წ., სხვ., წ., ა.შ, ერთ-ერთ, ა., ა.შ., ი., ე.ი., სამეცნიერო-კვლევითი, გ., დნმ-ის, ს., ფიზიკურ-გეოგრაფიული, 30-იან, დ., კ., რ., VI-ის, ვ., ზოოტექნიკურ-სავეტერინარო, მ., წწ., 1960-იან, აშშ-, აშშ-ის, სამეცნიერო-კვლევით, ფიზიკურ-ქიმიურ, ჯ., ჰ., I-ის, XVI-XVII, ახ., ბ., დაახლ., ერთ–ერთი, თსუ-, ისტორიულ-ეთნოგრაფიული, იხ., ლ., მოვლა-მოყვანის, მტკვარ-არაქსის, ნ.
- This corpus contains 3969 multi-word tokens. On average, one multi-word token consists of 2.01 syntactic words.
- There are 2163 types of multi-word tokens. Examples: საქართველოში, წლებში, ყველაზე, განმავლობაში, საუკუნეში, მიზანია, რომელშიც, როგორიცაა, საფუძველზე, დარგია, პერიოდში, ტერიტორიაზე, შემთხვევაში, წლიდან, პროცესში, დაკავშირებულია, საუკუნეებში, დარგში, დასაწყისში, შესაძლებელია, შესაძლოა, მასში, სამყაროში, ამოცანაა, მსოფლიოში, ქვეყანაში, წლებიდან, ამასთან, განვითარებაში, ერთმანეთთან, თავიდან, ორგანიზმში, როგორებიცაა, სისტემაში, სფეროში, დროში, მანძილზე, სივრცეში, ფარგლებში, ცნობილია, არაა, აღსანიშნავია, ბაზაზე, დროიდან, ზედაპირზე, პირობებში, საგანია, აუცილებელია, ბუნებაში, დონეზე.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: DET
- This corpus contains 13 word types tagged as particles (PART): ალბათ, არ, არა, არც, აღარ, ვერ, ვერც, თურმე, კი, მაინც, ო, რა, ხომ
- This corpus contains 73 lemmas tagged as pronouns (PRON): ამათი, ამგვარი, ამდენი, არა, არავინ, არაფერი, არცერთი, ასეთი, ერთ-ერთი, ერთადერთი, ერთგვარი, ერთერთი, ერთი, ერთიმეორე, ერთმანეთი, ეს, ეს(ე), ესა, ესე, ესენი, ვინ, ვინმე, ვისი, ზოგი, ზოგიერთი, თავად, თავი, თავიანთი, თავისი, თვით, თვითონ, თითოეული, თქვენ, იგი, იგინი, იმათი, იმდენი, იმისი, ის, ის(ი), ისეთი, ისი, ისინი, მათ, მათი, მე, მისი, რა, რაიმე, რამაც, რამდენი, რამდენიმე, რამე, რამოდენიმე, რანაირი, რაღაც, რითი, რისი, როგორ, როგორი, რომელი, რომელიც, რომლებიც, სხვა, ურთიერთი, ყველა, ყველაფერი, ყოველი, ყოველივე, შენ, ჩემი, ჩვენ, ჩვენი
- This corpus contains 0 lemmas tagged as determiners (DET):
- This corpus contains 2 lemmas tagged as auxiliaries (AUX): არის, უნდა
- There are 2 (de)verbal forms:
- Part
- VERB: დანალექი, ასახული, დამუხტული, დამზადებული, სარწყავი, წამკითხავი, წამყვან, არაევკლიდური, გარემოსდაცვითი, დამსახურებული
- Vnoun
- VERB: გამოსხივების, დარაიონება, გამოსხივებას, დაგეგმარების, დაკრისტალების, დაპროექტებისა, მოკვლევისა, მორწყვის, შეკავშირების, შესიტყვება
Nominal Features
- Anim
- NOUN: ადამიანის, საზოგადოების, ცხოველთა, ადამიანთა, საზოგადოება, ადამიანი, ავტორი, ხალხის, ცხოველების, მეცნიერმა
- Inan
- NOUN: წელს, მეცნიერება, საუკუნის, დარგი, განვითარების, დედამიწის, დროს, სისტემა, წლის, ტერმინი
- Plur
- ADJ: თავიანთ, საშუალებით, საწყისები, უკანასკნელთა, უსაფრთხოების, ძველთა, დაინტერესებულნი, მწოველები, ნაშრომები, სახელმწიფოები
- NOUN: წლებ, მცენარეთა, მეცნიერებათა, პროცესების, ქანების, ცხოველთა, მეთოდების, ადამიანთა, პროცესებს, დაავადებათა
- NUM: მე-3-4, პირველთაგანი
- PRON: მათ, რომლებიც, მათი, რომელთა, ისინი, ჩვენ, რომელთაც, რომლებსაც, ჩვენი, სხვათა
- PROPN: კლარკები, ოსმანთა, ალდეჰიდების, ანდრონიკაშვილების, ბრუნების, ენეადები, ვედები, თერგდალეულთა, თურმანიძეთა, იაგუაშვილები
- VERB-Part: დამუხტულებს, მონაცემების, ნამზადების, ნაწევები, ქსოვილების, ჩანაწერების
- VERB-Vnoun: გამოსხივებები, განხრების, დაძაბვები, შესიტყვებებად, ჩადაბლებებისა
- Sing
- ADJ: სხვადასხვა, საერთაშორისო, ქიმიური, დიდი, თანამედროვე, ძირითადი, სამეცნიერო, ახალი, ფიზიკური, სახელმწიფო
- AUX: ა
- NOUN: წელს, მეცნიერება, საუკუნის, ადამიანის, დარგი, განვითარების, დედამიწის, დროს, სისტემა, წლის
- NUM: პირველი, მეორე, ორი, ერთი, სამი, პირველ, ერთ, ბევრი, ორ, ხუთი
- PRON: რომელიც, სხვა, ამ, მისი, ყველა, იგი, ეს, იმ, მის, მას
- PROPN: საქართველოს, საქართველო, თბილისის, ალექსანდრე, ევროპა, აზერბაიჯანის, გიორგი, ამერიკის, ვახტანგ, თბილის
- VERB-Part: დანალექი, ასახული, დამუხტული, დამზადებული, სარწყავი, წამკითხავი, წამყვან, არაევკლიდური, გარემოსდაცვითი, დამსახურებული
- VERB-Vnoun: გამოსხივების, დარაიონება, გამოსხივებას, დაგეგმარების, დაკრისტალების, დაპროექტებისა, მოკვლევისა, მორწყვის, შეკავშირების, შესიტყვება
- Dat
- ADJ: სხვადასხვა, თანამედროვე, ქიმიურ, ძველ, ზოგად, ფიზიკურ, ცოცხალ, ახალ, მრავალ, საერთაშორისო
- ADP: ში, ზე, თან, შორის, შიც, შუა, ზეც, თანავე, ზევე, თანაც
- NOUN: წელს, დროს, წლებ, საუკუნე, განმავლობა, საფუძველ, პერიოდ, შემთხვევა, პროცეს, ტერიტორია
- NUM: მეორე, ერთ, პირველ, ორ, ბევრ, ათას, მესამე, ოთხ, მილიარდ, სამ
- PRON: მათ, მას, რომლის, სხვა, რომელსაც, ყველა, ამ, რომელ, იმ, მის
- PROPN: საქართველო, ევროპა, თბილის, საქართველოს, გერმანია, ამერიკა, რუსეთ, საბერძნეთ, არისტოტელეს, ბაბილონ
- VERB-Part: წამყვან, საცდელ, წამყვანი, ამღერებულ, გაურეცხავ, დამდეგს, დამლევს, დამუხტულ, დამუხტულებს, დაუსწრებელ
- VERB-Vnoun: გამოსხივებას, ამონთხევისას, გადახურება, გადმოკვეთისას, გამოდენას, გამოდნობას, განმუხტვისას, დაგზავნას, მონელებას, შეჯიბრებას
- Erg
- ADJ: გერმანელმა, რუსმა, ამერიკელმა, ინგლისელმა, არნახულმა, აღიარებულმა, ახალმა, ბიოფარმულმა, ბირთვულმა, ბიჰევიორისტულმა
- NOUN: მეცნიერმა, განვითარებამ, მექანიკამ, ქიმიკოსმა, გამოყენებამ, ფიზიკოსმა, ადამიანმა, ასტრონომმა, აღმოჩენებმა, გამოგონებამ
- NUM: პირველმა, VI-მ
- PRON: მან, რომელმაც, ამ, რამაც, მანვე, მათ, ამან, მე, მისმა, რამ
- PROPN: ალექსანდრე, ივანე, ჯონ, ანტონ, ბარიმ, გოეთემ, გრიგორ, დე, იოზეფ, ლაისტერმა
- VERB-Part: გახშირებულმა, დისკრეტულმა
- Ess
- ADJ: დამოუკიდებელ, უმთავრესად, ბოლო, თანამედროვე, ისტორიულად, მეტად, უმეტესად, ძირითად, ახლად, ბუნებრივად
- ADP: მდე, დმი, დან
- NOUN: შედეგად, მაგალითად, საფუძვლად, მეცნიერებად, მიზნად, დღე, დაწყება, ფუძემდებლად, წლება, დისციპლინად
- NUM: პირველ, ორ, ერთ, ათასა, მეორე, პირველად, 1859-1870-, 300-, 500-, ბევრად
- PRON: ერთ-ერთ, თავად, ასეთ, სხვა, ერთ, ერთადერთ, თავადვე, იმ, რამდენიმე, რანაირად
- PROPN: ანგსტრემა, ინდოეთა
- VERB-Part: ასაჭრელად, დამუხტულ
- VERB-Vnoun: შესიტყვებებად
- Gen
- ADJ: სხვადასხვა, ქიმიური, საერთაშორისო, ახალი, მსოფლიო, ისტორიული, ფიზიკური, ქართული, თანამედროვე, სამეცნიერო
- ADP: თვის, გან, შესახებ, მიერ, გამო, მიმართ, კენ, გარდა, გამოც, განაც
- NOUN: საუკუნის, ადამიანის, განვითარების, დედამიწის, წლის, სამართლის, ხელოვნების, ენის, კვლევის, მეურნეობის
- NUM: მეორე, პირველი, ორი, ერთი, სამი, VI-ის, ხუთი, I-ის, მეოცე, ათასი
- PRON: მისი, ამ, მათი, სხვა, მის, იმ, მათ, ყველა, რომელთა, ერთი
- PROPN: საქართველოს, თბილისის, აზერბაიჯანის, ამერიკის, კავკასიის, ვახტანგ, ნიუტონის, ალექსანდრე, ევროპის, კონფუცის
- VERB-Part: დანალექი, დამუხტული, სარწყავი, დაუსწრებელი, საკვები, ამომწყდარი, გადაშენებული, გაკუთხული, გამთბარი, გამომუშავებული
- VERB-Vnoun: გამოსხივების, დაგეგმარების, დაკრისტალების, დაპროექტებისა, მოკვლევისა, მორწყვის, შეკავშირების, ცვეთის, აგეგმვის, აგეგმვისა
- Ins
- ADJ: ფართო, სხვადასხვა, უძველესი, ბერძნული, სპეციალური, ფიზიკური, ქიმიური, ბოლო, გარკვეული, საერთო
- ADP: დან, დანვე, დანაც
- NOUN: მიზნით, საშუალებით, წლი, სახით, გაგებით, გამოყენებით, განსხვავებით, დაკავშირებით, შედარებით, წლები
- NUM: ერთი, ორი, სამი, პირველი, 103-, 199-, 20-, 2000–, 800-, მეორე
- PRON: ამ, სხვა, იმ, თავისი, ამით, ერთი, ისეთი, მისი, იმით, სხვ
- PROPN: ამიერკავკასიით, აფრიკი, აღმოსავლეთ, აღმოსავლეთით, ევროპი, რუსეთი
- VERB-Part: შესანიშნავი, დამლევი
- VERB-Vnoun: მორწყვით, მოძრაობით, ნაღველით, შერევით, შესუნთქვით, ჩანერგვით
- Nom
- ADJ: ძირითადი, დიდი, დაკავშირებული, მნიშვნელოვანი, მთავარი, საერთაშორისო, ცნობილი, ახალი, სამეცნიერო, ქიმიური
- ADP: ვით
- NOUN: მეცნიერება, დარგი, ტერმინი, ნაწილი, მნიშვნელობა, სამართალი, სისტემა, მიზანი, ისტორია, მოძღვრება
- NUM: პირველი, ორი, ერთი, ბევრი, მეორე, სამი, ცოტა, ხუთი, მილიონი, ოთხი
- PRON: რომელიც, იგი, რომლებიც, ეს, სხვა, ერთ-ერთი, ის, მისი, ისინი, ყველა
- PROPN: არისტოტელე, მაგმური, საქართველო, ალექსანდრე, გიორგი, იულიუს, აფრიკანუსი, მიხეილ, პლატონი, ფერმა
- VERB-Part: ასახული, დამზადებული, დანალექი, არაევკლიდური, დამსახურებული, დამუხტული, სარწყავი, საცდელი, წამკითხავი, აღმდგენი
- VERB-Vnoun: დარაიონება, შესიტყვება, აგეგმვა, აორთქლება, გადაქაჩვა, გაკაფვა, გამოსხივება, გამოსხივებაც, გამოსხივებები, გამოქცევა
- Voc
- NOUN: ფაქტო
Degree and Polarity
- Cmp
- ADJ: უფრო, მომრგვალო, უკეთესი
- Pos
- ADJ: დიდი, ახალი, ძველი, მთავარი, მნიშვნელოვანი, ფართო, მრავალი, ზოგადი, მეტი, საჭირო
- Sup
- ADJ: უძველესი, უმაღლეს, უმაღლესი, უდიდესი, უმნიშვნელოვანესი, უძველეს, უმთავრესად, უმარტივესი, უმნიშვნელოვანეს, უმცირესი
Verbal Features
- Imp
- VERB: შეიძლება, გამოიყენება, არსებობს, სწავლობს, იყენებენ, იკვლევს, ხდება, იყენებს, ეწოდება, უწოდებენ
- VERB-Vnoun: ცვეთის, ბეჭდვისა, გადაყვანის, განმუხტვისას, დაანგარიშება, დაძაბვები, დაძაბვის, დნობა, დნობის, კერვა
- Perf
- VERB: შეისწავლის, წარმოადგენს, მოიცავს, ჩამოყალიბდა, დაიწყო, შედგება, შეიქმნა, გახდა, განსაზღვრავს, მიიღო
- VERB-Vnoun: გამოსხივების, დარაიონება, გამოსხივებას, დაგეგმარების, დაკრისტალების, დაპროექტებისა, მოკვლევისა, მორწყვის, შეკავშირების, შესიტყვება
- Imp
- VERB: ითქვას, იქცეს, მოხდეს
- Ind
- AUX: ა, არის, იყო, უნდა, იყოს, არიან, იქნა, იქნება, იყვნენ, იქნას
- VERB: შეისწავლის, აქვს, შეიძლება, წარმოადგენს, გამოიყენება, მოიცავს, არსებობს, სწავლობს, ჩამოყალიბდა, იყენებენ
- VERB-Part: დანალექი, ასახული, დამუხტული, დამზადებული, სარწყავი, წამკითხავი, წამყვან, არაევკლიდური, გარემოსდაცვითი, დამსახურებული
- Sub
- VERB: გადაჭრილიყო, გახსნას, ეცნობოს, მიჰფენოდნენ, მოეღრიცოს, შეედაროს, შეექმნა, შეეწყოს, შეფასდეს, წარმოქმნას
- Fut
- AUX: იქნება, იქნებოდა
- VERB: შეისწავლის, წარმოადგენს, მოიცავს, შეიცავს, განსაზღვრავს, მიეკუთვნება, შედგება, განარჩევენ, განასხვავებენ, წარმოადგენენ
- VERB-Part: სარწყავი, წამყვან, საკვები, საცდელ, საცდელი, შესანიშნავი, წამყვანი, ასაჭრელად, გადასაყვანი, გასაფრენი
- Imp
- AUX: მინდოდა
- VERB: ჰქონდა, ხდებოდა, გამოიყენებოდა, იყენებდნენ, ვითარდებოდა, თვლიდა, არსებობდა, გულისხმობდა, იყენებდა, მდებარეობდა
- Past
- AUX: იყო, იყოს, იქნა, იყვნენ, იქნას, იქნეს
- VERB: ჩამოყალიბდა, დაიწყო, შეიქმნა, გახდა, მიიღო, დაარსდა, ჩაისახა, გაჩნდა, წარმოიშვა, შექმნა
- VERB-Part: ასახული, დამუხტული, დამზადებული, დამსახურებული, დამუხტულ, დანაკვთული, ამომწყდარი, ამღერებულ, აწეული, გადაშენებული
- PastPerf
- AUX: ყოფილა
- VERB: უკავია, შეუძლია, შეუძლიათ, უკავიათ, შექმნილა, აღმოუჩენია, გადაჭრილიყო, გამოჩენილა, დადგენილა, დამკვიდრებულა
- Pqp
- AUX: ყოფილიყო
- VERB: ჩაეყარა, გამოეყო, მიეცა, დაედო, მიეცათ, მიეძღვნა, აეყვანა, აეხსნათ, ამოეგდო, აღმოეჩინათ
- Pres
- AUX: ა, არის, უნდა, არიან, მინდა, ვარ, ხარ
- VERB: აქვს, შეიძლება, გამოიყენება, არსებობს, სწავლობს, იყენებენ, იკვლევს, ხდება, იყენებს, ეწოდება
- VERB-Part: დანალექი, წამკითხავი, არაევკლიდური, გარემოსდაცვითი, მღრღნელი, აღმდგენი, გადასაწყვეტი, გამთბარი, დამდეგს, დამლევი
- Act
- VERB: შეისწავლის, შეიძლება, წარმოადგენს, გამოიყენება, მოიცავს, არსებობს, სწავლობს, იყენებენ, იკვლევს, დაიწყო
- Mid
- VERB: ავიწყდება, ახსოვდა, გვწყუროდა, დამავიწყდა, მიეჩქარებოდათ, მქვია, მჯერა, სცხელოდა, წაადგებოდა
- Pass
- VERB: ჩამოყალიბდა, შეიქმნა, ეწოდება, გააჩნია, ითვლება, იძლევა, დაარსდა, წარმოიქმნება, წარმოიშვა, ჩაისახა
- Nfh
- PART: ო
- VERB: მიიღო, ამყოფო, შეუწყო
Pronouns, Determiners, Quantifiers
- Dem
- PRON: ამ, იმ, ეს, ისეთი, ასეთი, მათ, მის, ისეთ, ამავე, ის
- Ind
- PRON: ერთ-ერთი, რამდენიმე, ერთი, ზოგიერთი, ერთ-ერთ, ზოგიერთ, ზოგი, რაიმე, ერთ, ზოგ
- Int
- PRON: რომელ, რა, რის, რომელი, რომლებ, რომლებსაც, რამდენი, რითიც, ვის, რამ
- Neg
- PRON: არავის, არაფერს, არავინ, არა, არაფრით, არცერთი
- Prs
- PRON: მისი, მათ, იგი, მათი, მას, მის, ის, ისინი, ეს, თავისი
- Rcp
- PRON: ერთმანეთ, ერთმანეთს, ერთმანეთის, ერთმანეთისა, ურთიერთ
- Rel
- PRON: რომელიც, რომლებიც, რომლის, რომელსაც, რომელთაც, რომელთა, რა, რომელმაც, რომლებსაც, რამაც
- Tot
- PRON: სხვა, ყველა, ყოველი, თვით, თითოეული, სხვათა, ყოვლისა, ყველაფერი, ყოველ, თავად
- Card
- NUM: XIX, XX, ორი, ერთი, სამი, ერთ, XVII, XVIII, II, ორ
- Mult
- NUM: ორჯერ
- Ord
- NUM: პირველი, მეორე, პირველ, ბევრი, მესამე, ბევრ, მეოცე, ორივე, პირველმა, მე-20
- Yes
- PRON: მისი, მათი, თავისი, მის, თავის, მათ, ჩვენი, ჩემი, თავიანთი, თავად
- 1
- PRON: ჩვენ, ჩვენი, მე, ჩემი, თავიანთი, ჩემ, ჩვენს, მეც, ჩემს, ჩემა
- 2
- PRON: შენს, თქვენ, შენ
- 3
- AUX: ა
- PRON: ამ, მისი, მათ, იგი, ეს, მათი, იმ, მის, მას, ის
Other Features
- Abbr
- Yes
- ADJ: ბერძნ., ძვ., ინგლ., ლათ., ე.წ., ახ., ლიტ., ფრანგ., სხვ., აზერ.
- ADV: ა.შ.
- NOUN: მაგ., წ., ა.შ, ა., ი., ა.შ., გ., დ., კ., რ.
- PRON: სხვ., სხვ
- PROPN: პ., შ., აშშ-ის
- SCONJ: ე.ი.
- VERB: იხ.
- Yes
- AdpType
- Post
- ADJ: დაწერილ, შემდეგ
- ADP: ში, ზე, თან, დან, თვის, გან, შესახებ, შორის, მიერ, მდე
- NOUN: კონტრასტ, ადგილ, ადგილებ, გარდაქმნა, ეფექტურობა, ზღვებ, კავშირ, კონტექსტ, ლარამდე, მასშტაბამდე
- PRON: ამასთანა, ერთმანეთ, ყველაფერ
- VERB-Vnoun: გადახურება, დაქცევისათვის
- Post
- AdvType
- Cau
- ADV: აღსაწერად, გასავითარებლად, მოსაპოვებლად
- Deg
- ADV: ხშირად, საკმაოდ, მეტად, ამდენად, გაცილებით, იშვიათად, ათასობით, პირიქით, ნაწილობრივ, ოდნავ
- Int
- ADV: რატომ, როგორ, როდი, როდისა, სად, საიდან
- Loc
- ADV: აქ, აქედან, საზღვარგარეთ, ახლოს, გარშემო, ქვეშ, აქამდე, წინ, გარეთ, ირგვლივ
- Man
- ADV: ასევე, აგრეთვე, მიხედვით, მხოლოდ, ძირითადად, ერთად, ფართოდ, შესაბამისად, ისე, მეშვეობით
- Rel
- ADV: სადაც, რატომღაც, როგორც
- Tim
- ADV: შემდეგ, პირველად, ზოგჯერ, ჯერ, ამჟამად, უკვე, თავდაპირველად, დღეს, მოგვიანებით, ბოლოს
- Cau
- Foreign
- Yes
- X: the, logos, λόγος, of, de, art, fantasy, βίος, νόμος, -λογία
- Yes
- NameType
- Geo
- PROPN: საქართველოს, საქართველო, თბილისის, ევროპა, აზერბაიჯანის, ამერიკის, თბილის, კავკასიის, ამერიკა, გერმანია
- Prs
- PROPN: ალექსანდრე, გიორგი, ვახტანგ, ჯონ, არისტოტელე, არისტოტელეს, დე, კონფუცის, მაგმური, გივი
- Sur
- PROPN: ნიუტონის, რუსთაველის, ტიურინგის, გალილეის, კლარკის, ტოლკინის, ჯანდიერის, გოგინაშვილი, გოგინაშვილის, თუმანიშვილის
- Geo
- NumForm
- Digit
- NUM: 1992, 1999, 2, 1, 2008, 30-იან, 11, 20, 2001, 2005
- Roman
- NUM: XIX, XX, XVII, XVIII, II, I, VI-ის, XVI, I-ის, III
- Digit
- Number[io]
- Plur
- VERB: გვხვდება, გვევლინება, მოგვითხრობს, გვხვდებოდა, შემოგვინახა, გაგვანდო, გეხახუნებათ, გვაფიქრებინებს, გვიქმნის, გვიჩვენოს
- Sing
- VERB: მიჰყვება, დამჭირდება, მეკითხება, მეძახიან, მიაჩნდეს, მიუძღვით, სწამებენ
- Plur
- Number[obj]
- Plur
- VERB: გააჩნიათ, მიაჩნიათ, მოგვცეს, შემოგვთავაზა, აინტერესებდათ, გვაფრთხილებს, გვაწვდის, გვთავაზობს, დაგვანახოს, ევალებათ
- Sing
- VERB: გამოსცა, ახლავს, აღწევს, ახლდეს, გასდევს, გახადოს, დაუჭერს, მაინტერესებს, მითხოვია, მჭრის
- Plur
- Number[subj]
- Plur
- AUX: არიან, იყვნენ, იქნეს, ა
- VERB: იყენებენ, უწოდებენ, აქვთ, განარჩევენ, განასხვავებენ, წარმოადგენენ, ეკუთვნის, ვხვდებით, იყენებდნენ, განსაზღვრავენ
- Sing
- AUX: ა, არის, იყო, უნდა, იყოს, იქნა, იქნება, იქნას, იქნებოდა, მინდა
- VERB: შეისწავლის, აქვს, შეიძლება, წარმოადგენს, გამოიყენება, მოიცავს, არსებობს, სწავლობს, ჩამოყალიბდა, იკვლევს
- Plur
- PartType
- Emp
- ADJ: მეტიც, ძველთა, განსხვავებულიც, გასაგებიცა, გასავლელადაც, საერთოც, სრულებითაც, უსასრულოც, შემდგომიც, შემცველიცა
- ADP: გამოც, შორისაც
- ADV: დღესაც, შემდეგაც, მიხედვითაც, მალევე, რატომღაც, ადრეც, გარეთაც, გასაუმჯობესებლადაც, თანახმადაც, იქვე
- NOUN: დროსაც, საფუძველ, გამოყენებაც, დადგენაც, დრო, მოვლენადაც, ობსერვატორიაც, საშუალებითაც, ფილოლოგიასაც, შედეგადაც
- NUM: მეორეც, ერთიცა, მეორე, პირველივე
- PART: კი, მაინც, არც, ვერც
- PRON: რომელ, რომლებ, მეც, ვინმე, ვინც, იგივე, იმავე, მასაც, რომელნიც, რომელსაც
- PROPN: დავითისივე, ევროპა, ზარანდიასაც, საქართველო
- Int
- PART: ალბათ, ხომ, თურმე
- Neg
- PART: არ, არა, ვერ, აღარ
- Emp
- Person[io]
- 1
- VERB: გვხვდება, გვევლინება, მოგვითხრობს, გვხვდებოდა, მიჰყვება, შემოგვინახა, გაგვანდო, გვაფიქრებინებს, გვაფრთხილებს, გვაწვდის
- 2
- VERB: გაინტერესებთ, გეხახუნებათ
- 3
- VERB: უწოდებენ, მიეკუთვნება, ახასიათებს, უკავშირდება, განეკუთვნება, ეკუთვნის, ემყარება, ეხება, ამუშავებს, არეგულირებს
- 1
- Person[obj]
- 1
- VERB: მოგვცეს, შემოგვთავაზა, აინტერესებდათ, გვთავაზობს, დაგვანახოს, მაინტერესებს, მოგვცა, მჭრის
- 2
- VERB: გასდევს, შეგიძლიათ, შეექმნა, შეეწყო
- 3
- AUX: უნდა, მინდა, მინდოდა
- VERB: შეისწავლის, აქვს, წარმოადგენს, მოიცავს, სწავლობს, იყენებენ, იკვლევს, იყენებს, დაიწყო, ეწოდება
- 1
- Person[subj]
- 1
- AUX: მინდა, ვარ, მინდოდა
- VERB: ვხვდებით, ვწერ, აღმოვაჩენთ, განვიხილოთ, გვაქვს, ვიქონიოთ, მაქვს, ავივსო, ამოვალთ, აღვნიშნოთ
- 2
- AUX: ა, იყვნენ, იყო, ხარ
- VERB: მიიღო, შეიქმნა, ახასიათებთ, აერთიანებთ, აღმოაჩენ, შევიდა, შეუწყო, აამოძრაოთ, აირევი, ამყოფო
- 3
- AUX: არის, იყო, უნდა, ა, იყოს, არიან, იქნა, იქნება, იქნას, იყვნენ
- VERB: შეისწავლის, აქვს, შეიძლება, წარმოადგენს, გამოიყენება, მოიცავს, არსებობს, სწავლობს, ჩამოყალიბდა, იყენებენ
- 1
- PunctType
- Brck
- PUNCT: (, ), <, [, ], >
- Colo
- PUNCT: :
- Comm
- PUNCT: ,
- Dash
- PUNCT: —, -, –
- Elip
- PUNCT: ...
- Excl
- PUNCT: !
- Peri
- PUNCT: .
- Qest
- PUNCT: ?
- Quot
- PUNCT: „, “, ", ”, “-
- Semi
- PUNCT: ;
- Brck
- Subcat
- Indir
- VERB: ხდება, გახდა, გვხვდება, შედგება, ხდებოდა, ვხვდებით, მოხდა, ჰქვია, ეყრდნობა, რჩება
- Intr
- AUX: ა, არის, იყო, იყოს, არიან, იქნა, იქნება, იყვნენ, იქნას, იქნეს
- VERB: აქვს, შეიძლება, გამოიყენება, არსებობს, ჩამოყალიბდა, შეიქმნა, ეწოდება, აქვთ, გულისხმობს, შედგება
- Tran
- AUX: უნდა, მინდა, მინდოდა
- VERB: შეისწავლის, წარმოადგენს, მოიცავს, სწავლობს, იყენებენ, იკვლევს, დაიწყო, იყენებს, განსაზღვრავს, უწოდებენ
- Indir
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: არის.
- This corpus uses 1 lemmas as auxiliaries (aux). Examples: უნდა.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (9)
- VERB--NOUN-Dat (169)
- VERB--NOUN-Erg (153)
- VERB--NOUN-Gen (1)
- VERB--NOUN-Nom (1514)
- VERB--PRON-Dat (52)
- VERB--PRON-Erg (38)
- VERB--PRON-Ess (1)
- VERB--PRON-Gen (12)
- VERB--PRON-Ins (1)
- VERB--PRON-Nom (513)
- VERB-Part--NOUN-Dat (1)
- VERB-Part--NOUN-Nom (15)
- VERB-Part--PRON-Nom (4)
- VERB-Vnoun--NOUN-Nom (2)
- VERB-Vnoun--PRON-Nom (1)
- obj
- VERB--NOUN (2)
- VERB--NOUN-Dat (1281)
- VERB--NOUN-Dat-ADP(ზე) (1)
- VERB--NOUN-Dat-ADP(ში) (1)
- VERB--NOUN-Erg (3)
- VERB--NOUN-Ess (5)
- VERB--NOUN-Gen (5)
- VERB--NOUN-Ins (1)
- VERB--NOUN-Nom (630)
- VERB--NOUN-Nom-ADP(შესახებ) (1)
- VERB--PRON-Dat (83)
- VERB--PRON-Ess (2)
- VERB--PRON-Gen (5)
- VERB--PRON-Ins (2)
- VERB--PRON-Nom (19)
- VERB-Part--NOUN-Dat (2)
- VERB-Part--NOUN-Ess (1)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Nom (2)
- VERB-Vnoun--NOUN-Dat (1)
- VERB-Vnoun--NOUN-Gen (2)
- VERB-Vnoun--NOUN-Nom (1)
- iobj
- VERB--NOUN (2)
- VERB--NOUN-Dat (148)
- VERB--NOUN-Nom (5)
- VERB--PRON-Dat (16)
- VERB--PRON-Gen (1)
- VERB-Vnoun--NOUN-Dat (1)
Relations Overview
- This corpus uses 8 relation subtypes: acl:relcl, advmod:lmod, det:poss, flat:foreign, flat:name, nsubj:outer, nsubj:pass, obl:tmod
- The following 6 relation types are not used in this corpus at all: vocative, dislocated, clf, list, goeswith, reparandum