PředmětyPředměty(verze: 875)
Předmět, akademický rok 2020/2021
  
Závislostní gramatiky a korpusy - NPFL075
Anglický název: Dependency Grammars and Treebanks
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Garant: doc. RNDr. Markéta Lopatková, Ph.D.
RNDr. Daniel Zeman, Ph.D.
RNDr. Jiří Mírovský, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (21.05.2020)
Cílem předmětu je seznámit studenty se závislostním popisem přirozeného jazyka a využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Zásadní pozornost je věnována projektu Pražského závislostního korpusu a projektu Universal Dependencies – jejich východiskům, úrovním anotace a způsobům zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusy. Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Markéta Lopatková, Ph.D. (19.05.2020)

Předmět je zakončen písemným testem, který obsahuje otázky z témat podle sylabu, s možným dozkoušením - k úspěšnému absolvování student musí získat alespoň 50% bodů. Získání zápočtu je podmíněno vypracováním všech domácích úkolů (zápočet není nutno získat před písemným testem). Podrobnější požadavky jsou uvedeny na stránkách předmětu http://ufal.mff.cuni.cz/courses/npfl075

Literatura -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (29.01.2019)
  • Hajičová, E., Panevová, J., Sgall, P. (2002) Úvod do teoretické a počítačové lingvistiky, sv. I. Karolinum, Praha.
  • Hajič J., Hajičová E., Mikulová M., Mírovský J.: Prague Dependency Treebank. In N. Ide & J. Pustejovsky (eds.): Handbook of Linguistic Annotation. Dordrecht 2017, pp. 555-594.
  • PDT Guide - http://ufal.mff.cuni.cz/pdt2.0/
  • PDT documentation - https://ufal.mff.cuni.cz/pdt3.5/documentation
  • Nivre, J., de Marneffe, M.C., Ginter, F., Goldberg, Y., Hajič, J., Manning, C., McDonald, R., Petrov, S., Pyysalo, S., Silveira, N., Tsarfaty, R., Zeman, D. (2006) Universal Dependencies v1: A Multilingual Treebank Collection. In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016), ELRA, Paris, pp. 1659-1666.
  • Universal Dependencies - http://universaldependencies.org/
  • Zeman, D.: The World of Tokens, Tags and Trees. Studies in Computational and Theoretical Linguistics, vol. 19. ÚFAL, Praha, 2018, ISBN 978-80-88132-09-7.
  • Partee, B. H., ter Meulen, A., Wall, R.E.: Mathematical Methods in Linguistics. Studies in Linguistics and Philosophy, vol. 30, Kluwer Academic Publishers, Dordrecht, Boston, London, 1990.

Sylabus -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (29.01.2019)
  1. Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)
  2. Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)
  3. Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ
  4. Universal Dependencies - úvod a principy
  5. Stratifikační přístup k popisu přirozeného jazyka:
    • morfologie a její zachycení v závislostních korpusech
    • (povrchová) syntax a její zachycení v závislostních korpusech
    • (hloubková) syntax a její zachycení v závislostních korpusech
  6. Zachycení dalších vybraných jevů hloubkové syntaxe
  7. Anotační schémata, formáty dat
  8. Používané nástroje (TrEd, PML-TQ, Udapi)
 
Univerzita Karlova | Informační systém UK