The goal of the course is to introduce a dependency-based description of natural languages, principles of
dependency-based grammar formalisms and their application in morphologically and syntactically annotated
corpora. The course will focus on the Prague Dependency Treebank project and on the Universal Dependencies
project. The emphasis is also placed on annotation schemata and data formats, on practical work with treebanks
and useful tools. The course is designed for students with the computer science background as well as for linguists
with some CS experience.
Cílem předmětu je seznámit studenty se základy závislostního popisu přirozeného jazyka a s využitím principů
závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Hlavní pozornost je věnována projektu
Pražského závislostního korpusu a projektu Universal Dependencies – jejich východiskům, úrovním anotace a
způsobům zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na
seznámení s používanými nástroji a na praktické zvládnutí práce s korpusy. Předmět je určen studentům
nejrůznějšího zaměření (informatika, aplikovaná lingvistika).
Course completion requirements -
To pass the course, you will be required to actively participate in the classes and to submit all of the homework tasks. The quality of your homework solutions will determine your grade. More detailed information on grading can be found at the course webpage
K absolvování kurzu je vyžadována aktivní úcast na cviceních a odevzdání všech domácích úkolu. Kvalita rešení domácích úkolu se promítne do výsledné známky. Podrobnejší informace k úkolum a hodnocení jsou k dispozici na stránce
Literature -
Hajič J., Hajičová E., Mikulová M., Mírovský J.: Prague Dependency Treebank. In N. Ide & J. Pustejovsky (eds.): Handbook of Linguistic Annotation. Dordrecht 2017, pp. 555-594.
Nivre, J., de Marneffe, M.C., Ginter, F., Goldberg, Y., Hajič, J., Manning, C., McDonald, R., Petrov, S., Pyysalo, S., Silveira, N., Tsarfaty, R., Zeman, D. (2006) Universal Dependencies v1: A Multilingual Treebank Collection. In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016), ELRA, Paris, pp. 1659-1666.
Zeman, D.: The World of Tokens, Tags and Trees. Studies in Computational and Theoretical Linguistics, vol. 19. ÚFAL, Praha, 2018, ISBN 978-80-88132-09-7.
Partee, B. H., ter Meulen, A., Wall, R.E.: Mathematical Methods in Linguistics. Studies in Linguistics and Philosophy, vol. 30, Kluwer Academic Publishers, Dordrecht, Boston, London, 1990 (chapter 16)
Hajičová, E., Panevová, J., Sgall, P. (2002) Úvod do teoretické a počítačové lingvistiky, sv. I. Karolinum, Praha.
Syllabus -
Trees as a data structure (dependency trees, phrase-based trees, word order, projectivity)
Dependency and non-dependency relations in natural languages
Family of Prague Dependency Treebanks - introduction and principles; Functional Generative
Description as their theoretical basis
Universal Dependencies - introduction and principles
Stratificational approach to natural language description:
morphology and its annotation in dependency treebanks
(surface) syntax and its annotation in dependency treebanks
(deep) syntax and its annotation in dependency treebanks