PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Závislostní gramatiky a korpusy - NPFL075
Anglický název: Dependency Grammars and Treebanks
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2022
Semestr: letní
E-Kredity: 3
Rozsah, examinace: letní s.:1/1, KZ [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl075
Garant: RNDr. Daniel Zeman, Ph.D.
RNDr. Jiří Mírovský, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Neslučitelnost : NPFX075
Záměnnost : NPFX075
Je neslučitelnost pro: NPFX075
Je záměnnost pro: NPFX075
Anotace -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (10.05.2022)
Cílem předmětu je seznámit studenty se základy závislostního popisu přirozeného jazyka a s využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Hlavní pozornost je věnována projektu Pražského závislostního korpusu a projektu Universal Dependencies – jejich východiskům, úrovním anotace a způsobům zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusy. Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (10.05.2022)

K absolvování kurzu je vyžadována aktivní úcast na cviceních a odevzdání všech domácích úkolu. Kvalita rešení domácích úkolu se promítne do výsledné známky. Podrobnejší informace k úkolum a hodnocení jsou k dispozici na stránce https://ufal.mff.cuni.cz/courses/npfl075

Literatura -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (10.05.2022)
  • Hajičová, E., Panevová, J., Sgall, P. (2002) Úvod do teoretické a počítačové lingvistiky, sv. I. Karolinum, Praha.
  • Hajič J., Hajičová E., Mikulová M., Mírovský J.: Prague Dependency Treebank. In N. Ide & J. Pustejovsky (eds.): Handbook of Linguistic Annotation. Dordrecht 2017, pp. 555-594.
  • PDT Guide - http://ufal.mff.cuni.cz/pdt2.0/
  • PDT documentation - https://ufal.mff.cuni.cz/pdt3.5/documentation
  • Nivre, J., de Marneffe, M.C., Ginter, F., Goldberg, Y., Hajič, J., Manning, C., McDonald, R., Petrov, S., Pyysalo, S., Silveira, N., Tsarfaty, R., Zeman, D. (2006) Universal Dependencies v1: A Multilingual Treebank Collection. In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016), ELRA, Paris, pp. 1659-1666.
  • Universal Dependencies - http://universaldependencies.org/
  • Zeman, D.: The World of Tokens, Tags and Trees. Studies in Computational and Theoretical Linguistics, vol. 19. ÚFAL, Praha, 2018, ISBN 978-80-88132-09-7.
  • Partee, B. H., ter Meulen, A., Wall, R.E.: Mathematical Methods in Linguistics. Studies in Linguistics and Philosophy, vol. 30, Kluwer Academic Publishers, Dordrecht, Boston, London, 1990 (kapitola 16)

Sylabus -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (09.05.2023)
  1. Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)
  2. Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)
  3. Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ
  4. Universal Dependencies - úvod a principy
  5. Stratifikační přístup k popisu přirozeného jazyka:
    • morfologie a její zachycení v závislostních korpusech
    • (povrchová) syntax a její zachycení v závislostních korpusech
    • (hloubková) syntax a její zachycení v závislostních korpusech
  6. Zachycení dalších vybraných jevů hloubkové syntaxe
  7. Anotační schémata, formáty dat
  8. Používané nástroje (TrEd, PML-TQ, Udapi)
 
Univerzita Karlova | Informační systém UK