Treebank Statistics: UD_Czech-PDT: Features: Animacy
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
66612 tokens (20%) have a non-empty value of Animacy
.
22869 types (43%) occur at least once with a non-empty value of Animacy
.
11572 lemmas (43%) occur at least once with a non-empty value of Animacy
.
The feature is used with 8 part-of-speech tags: NOUN (34831; 10% instances), ADJ (16397; 5% instances), PROPN (9109; 3% instances), VERB (2853; 1% instances), DET (1569; 0% instances), PRON (933; 0% instances), NUM (586; 0% instances), AUX (334; 0% instances).
NOUN
34831 NOUN tokens (42% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Gender=Masc (34831; 100%), Number=Sing (23165; 67%).
NOUN
tokens may have the following values of Animacy
:
Anim
(8907; 26% of non-emptyAnimacy
): lidí, předseda, ministr, prezident, lidé, ředitel, ministra, prezidenta, člověk, trenérInan
(25924; 74% of non-emptyAnimacy
): roku, roce, případě, rok, zákona, světa, trhu, zájem, zákon, penízeEMPTY
(48342): let, p, korun, Kč, strany, firmy, práce, společnosti, době, jednání
Paradigm člen | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | člena | |
Case=Acc|Number=Plur | členy | |
Case=Dat|Number=Plur | členům | |
Case=Gen|Number=Sing | člena | |
Case=Gen|Number=Plur | členů | |
Case=Ins|Number=Sing | členem | |
Case=Ins|Number=Plur | členy | členy |
Case=Loc|Number=Plur | členech | |
Case=Nom|Number=Sing | člen | člen |
Case=Nom|Number=Plur | členové |
Animacy
seems to be lexical feature of NOUN
. 100% lemmas (3300) occur only with one value of Animacy
.
ADJ
16397 ADJ tokens (40% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Gender=Masc (15981; 97%), Polarity=Pos (15364; 94%), Degree=Pos (14605; 89%), VerbForm=EMPTY (14049; 86%), Voice=EMPTY (14049; 86%), Number=Sing (9985; 61%).
ADJ
tokens may have the following values of Animacy
:
Anim
(3919; 24% of non-emptyAnimacy
): další, bývalý, českých, mnozí, první, dalších, český, jediný, čeští, americkýInan
(12478; 76% of non-emptyAnimacy
): další, první, nový, českého, velký, český, celý, větší, dalším, druhýEMPTY
(24370): české, první, další, druhé, nové, možné, národní, poslední, česká, vlastní
Paradigm český | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | českého | český |
Case=Acc|Number=Plur | české | české |
Case=Dat|Number=Sing | českému | českému |
Case=Dat|Number=Plur | českým | českým |
Case=Gen|Number=Sing | českého | českého |
Case=Gen|Number=Plur | českých | českých |
Case=Ins|Number=Sing | českým | českým |
Case=Ins|Number=Plur | českými | českými |
Case=Loc|Number=Sing | českém | |
Case=Nom|Number=Sing | český | český |
Case=Nom|Number=Plur | čeští | české |
PROPN
9109 PROPN tokens (58% of all PROPN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PROPN
and Animacy
co-occurred: Gender=Masc (9109; 100%), Number=Sing (8561; 94%), NameType=Giv (6859; 75%), Case=Nom (5609; 62%).
PROPN
tokens may have the following values of Animacy
:
Anim
(7316; 80% of non-emptyAnimacy
): Jiří, Jan, Václav, Vladimír, Klaus, Petr, Pavel, Josef, Jana, JohnInan
(1793; 20% of non-emptyAnimacy
): Londýně, Hradec, Washingtonu, Bonn, Yorku, Berlíně, Zlín, Berlín, Bonnu, ReuterEMPTY
(6632): Praha, ČR, ODS, Praze, LN, USA, OSN, Německu, Evropě, ČSFR
Paradigm Martin | Anim | Inan |
---|---|---|
Case=Acc|NameType=Giv | Martina | |
Case=Gen|NameType=Geo | Martina | |
Case=Gen|NameType=Giv | Martina | |
Case=Ins|NameType=Giv | Martinem | |
Case=Nom|NameType=Giv | Martin |
Animacy
seems to be lexical feature of PROPN
. 100% lemmas (3272) occur only with one value of Animacy
.
VERB
2853 VERB tokens (10% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (2853; 100%), Number=Plur (2853; 100%), Person=EMPTY (2853; 100%), Tense=Past (2853; 100%), VerbForm=Part (2853; 100%), Voice=Act (2853; 100%), Polarity=Pos (2624; 92%), Gender=Masc (1822; 64%), Aspect=Perf (1612; 57%).
VERB
tokens may have the following values of Animacy
:
Anim
(1822; 64% of non-emptyAnimacy
): měli, mohli, chtěli, museli, začali, neměli, přišli, dostali, získali, rozhodliInan
(1031; 36% of non-emptyAnimacy
): měly, mohly, začaly, objevily, neměly, vedly, získaly, musely, potvrdily, přišlyEMPTY
(26366): má, může, řekl, mají, měl, jde, musí, měla, lze, mít
Paradigm mít | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | neměli | |
Gender=Masc|Polarity=Pos | měli | |
Gender=Fem,Masc|Polarity=Neg | neměly | |
Gender=Fem,Masc|Polarity=Pos | měly |
DET
1569 DET tokens (12% of all DET
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which DET
and Animacy
co-occurred: Gender=Masc (1569; 100%), Number[psor]=EMPTY (1465; 93%), Person=EMPTY (1465; 93%), Poss=EMPTY (1328; 85%), Number=Plur (880; 56%), Case=Nom (877; 56%).
DET
tokens may have the following values of Animacy
:
Anim
(685; 44% of non-emptyAnimacy
): kteří, ti, někteří, všichni, každý, sami, naši, každého, svého, kteréhoInan
(884; 56% of non-emptyAnimacy
): které, svůj, který, tento, tyto, každý, ty, některé, náš, tenEMPTY
(11229): to, které, jeho, který, která, jejich, své, tím, tom, této
Paradigm ten | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | toho | ten |
Case=Acc|Number=Plur | ty | ty |
Case=Nom|Number=Plur | ti | ty |
PRON
933 PRON tokens (9% of all PRON
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PRON
and Animacy
co-occurred: Reflex=EMPTY (933; 100%), Variant=EMPTY (933; 100%), PrepCase=EMPTY (930; 100%), Person=EMPTY (916; 98%), Gender=EMPTY (905; 97%), Number=EMPTY (905; 97%), PronType=Int,Rel (586; 63%), Case=Nom (484; 52%).
PRON
tokens may have the following values of Animacy
:
Anim
(361; 39% of non-emptyAnimacy
): kdo, nikdo, někdo, oni, koho, někoho, nikoho, komu, nikomu, kdokoliInan
(572; 61% of non-emptyAnimacy
): co, něco, čím, čem, čeho, cosi, čemu, cokoli, něčeho, něčemEMPTY
(9163): se, si, nás, je, nám, mu, ji, což, nich, mi
Paradigm jenž | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing|PrepCase=Npr | jehož | |
Case=Nom|Number=Plur | jež |
Animacy
seems to be lexical feature of PRON
. 94% lemmas (17) occur only with one value of Animacy
.
NUM
586 NUM tokens (6% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: Gender=Masc (586; 100%), NumType=Card (585; 100%), NumForm=EMPTY (530; 90%).
NUM
tokens may have the following values of Animacy
:
Anim
(16; 3% of non-emptyAnimacy
): jednoho, jedniInan
(570; 97% of non-emptyAnimacy
): tisíc, miliónů, milionů, jeden, tisíce, mil, miliónu, milionu, milióny, milionyEMPTY
(8672): 1, 2, 3, tři, dva, dvě, 4, 10, 5, dvou
Paradigm jeden | Anim | Inan |
---|---|---|
jednoho | jeden |
AUX
334 AUX tokens (3% of all AUX
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which AUX
and Animacy
co-occurred: Aspect=Imp (334; 100%), Mood=EMPTY (334; 100%), Number=Plur (334; 100%), Person=EMPTY (334; 100%), Tense=Past (334; 100%), VerbForm=Part (334; 100%), Voice=Act (334; 100%), Polarity=Pos (293; 88%), Gender=Fem,Masc (226; 68%).
AUX
tokens may have the following values of Animacy
:
Anim
(108; 32% of non-emptyAnimacy
): byli, nebyliInan
(226; 68% of non-emptyAnimacy
): byly, nebyly, bývaly, bývávalyEMPTY
(10419): je, by, jsou, bude, byl, být, jsem, bylo, není, jsme
Paradigm být | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | nebyli | |
Gender=Masc|Polarity=Pos | byli | |
Gender=Fem,Masc|Polarity=Neg | nebyly | |
Gender=Fem,Masc|Polarity=Pos | byly |
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[amod]–> ADJ (13593; 98%),
NOUN –[flat]–> PROPN (2063; 100%),
PROPN –[flat]–> PROPN (1460; 99%),
PROPN –[conj]–> PROPN (519; 68%),
ADJ –[conj]–> ADJ (503; 86%),
ADJ –[nsubj]–> NOUN (412; 67%),
PROPN –[amod]–> ADJ (312; 91%),
PROPN –[appos]–> NOUN (117; 80%),
NOUN –[case]–> NOUN (55; 51%),
NOUN –[xcomp]–> ADJ (32; 70%).