PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Úvod do počítačové lingvistiky - NPFL012
Anglický název: Introduction to Computer Linguistics
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2014
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:2/0, Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: doc. RNDr. Vladislav Kuboň, Ph.D.
Třída: Informatika Bc.
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Je prerekvizitou pro: NPFL030, NPFL028
Anotace -
Poslední úprava: T_UFAL (10.05.2001)
Seznámení s hlavními obory počítačové lingvistiky a s problémy, které tyto obory řeší. Důraz je kladen na zejména na strojový překlad, syntaktickou analýzu, morfologii a korpusovou lingvistiku.
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.10.2017)

Předmět je zakončen písemnou zkouškou, která obsahuje otázky z témat odpřednesených v průběhu semestru. Počet otázek je 8-10, jedna z nich vyžaduje rozsáhlejší odpověď a týká se popisu některého z přednesených algoritmů.

Literatura -
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (16.05.2023)
  • R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
  • P. Sgall. E. Hajičová and J. Panevová. Učíme stroje česky. Academia. P. Sgall a kolektiv. Úvod do syntaxe a sémantiky. Academia. 1986.
  • Daniel Juraffsky, James H. Martin: Speech and Language processing (draft of the 3rd edition available at https://web.stanford.edu/~jurafsky/slp3/) 2023
  • KIRSCHNER. Z. (1983). MOSAIC - A Method of Automatic Extraction of Significant Terms from Texts. Praha : MFF UK, 1983. 124 s.
  • Králíková, K., Panevová, J. (1990). "ASIMUT - A Method for Automatic Information Retrieval from Full Texts", Explizite Beschreibung der Sprache und automatische Textbearbeitung XVII, Faculty of Mathematics and Physics, Charles University, Prague.
  • Jan Hajič, Alena Böhmová, Eva Hajičová, Barbora Vidová Hladká: "The Prague Dependency Treebank: A Three-Level Annotation Scenario". In: A. Abeillé (ed.): Treebanks: Building and Using Parsed Corpora, Amsterdam:Kluwer, 2000, pp. 103-127

Sylabus -
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.05.2023)

1. Úvod, přehled podoborů počítačové lingvistiky a jejich obsah

2. Přirozený jazyk, jeho funkce a struktura

3. Zpracování jazyka na úrovni znaků, morfologická analýza a značkování, metody korekce překlepů

4. Základní principy fungování skrytých Markovských modelů v morfologii přirozených jazyků

5. Využití vlastností češtiny v jednoduchých aplikacích (systémy ASIMUT a MOZAIKA)

6. Syntaxe jazyka a její formální zachycení v datových strukturách - složkové a závislostní stromy

7. Neprojektivní konstrukce v češtině

8. Přehled formálních teorií syntaxe - Transformační gramatika, LFG, TAG, unifikační formalismy, Funkční generativní popis

9. Nástroje pro syntaktickou analýzu jazyků - Q-systémy, rozšířené přechodové sítě

10. Metody kontroly gramatické správnosti (grammar checker)

11. Korpusová lingvistika

12. Historie a metody automatického překladu

13. Úvod do sémantiky - lexikální sémantika, reprezentace významu vět.

14. Anaforické vztahy ve větě.

15. Postojová analýza

 
Univerzita Karlova | Informační systém UK