Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (29.01.2019)
Cílem předmětu je seznámit studenty s projektem Pražského závislostního korpusu (PDT 2.0)
počínaje jeho teoretickými východisky, přes jednotlivé roviny anotace a konče způsobem
zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na
seznámení s používanými nástroji a na praktické zvládnutí práce s korpusem.
Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (29.01.2019)
The subject should make the students familiar with Prague Dependency Treebank (PDT 2.0)
project, starting from its theoretical base, including particular layers of annotation and ending with
the way how important linguistic phenomena are represented. Emphasis is also placed on
annotation schemata and data format, on familiarization with useful tools and practical work with the
treebank.
Hajičová, E., Panevová, J., Sgall, P. (2002) Úvod do teoretické a počítačové lingvistiky, sv. I. Karolinum, Praha.
Jan Hajič: Disambiguation of Rich Inflection (Computational Morphology of Czech). Karolinum, Charles Univeristy Press, Prague, Czech Republic, 2004.
Anotace na analytické rovině. Návod pro anotátory. Technická zpráva ÚFAL TR-1997-03, Universita Karlova, 1997 (http://ufal.ms.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html)
Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolářová-Řezníčková, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Magda Razímová, Petr Sgall, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský: "Anotace Pražského závislostního korpusu na tektogramatické rovině: pokyny pro anotátory". 2005 (http://ufal.ms.mff.cuni.cz/pdt2.0/doc/manuals/cz/t-layer/html/index.html)
Hajičová, E., Panevová, J., Sgall, P. (2002) Úvod do teoretické a počítačové lingvistiky, sv. I. Karolinum, Praha.
Jan Hajič: Disambiguation of Rich Inflection (Computational Morphology of Czech). Karolinum, Charles Univeristy Press, Prague, Czech Republic, 2004.
Anotace na analytické rovině. Návod pro anotátory. Technická zpráva ÚFAL TR-1997-03, Universita Karlova, 1997 (http://ufal.ms.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html)
Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolářová-Řezníčková, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Magda Razímová, Petr Sgall, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský: "Anotace Pražského závislostního korpusu na tektogramatické rovině: pokyny pro anotátory". 2005 (http://ufal.ms.mff.cuni.cz/pdt2.0/doc/manuals/cz/t-layer/html/index.html)
Sylabus -
Poslední úprava: T_UFAL (04.05.2017)
1. Teoretické základy - Funkční generativní popis (systém rovin, vztah kompozice a vztah formy a funkce, závislostní a ?nezávislostní" vztahy).
2. Morfologická rovina (tokenizace, lema, tag).
3. Analytická rovina (závislostní strom, analytická funkce, slovosled a projektivita).
1. Theoretical background - Functional generative description (system of layers, relation of composition and relations of form and function, dependency and non-dependency relations).