Zpracování přirozeného jazyka - NPFL124
Anglický název: Natural Language Processing
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: letní
E-Kredity: 4
Rozsah, examinace: letní s.:2/1, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl124
Garant: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Výsledky anket   Termíny zkoušek   Rozvrh LS   Nástěnka   
Anotace -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (03.05.2019)
V předmětu se studenti seznámí se standardními, základními, převážně statistickými, metodami v oblasti zpracování přirozeného jazyka (NLP). Studenti si po teoretické i implementační stránce osvojí potřebné techniky a seznámí se jak se základními komponentami jako jsou korpusy a jazykové modely, tak s komplexními koncovými aplikacemi NLP, například strojovým překladem.
Podmínky zakončení předmětu -
Poslední úprava: doc. Ing. Zdeněk Žabokrtský, Ph.D. (13.06.2019)

K absolvování předmětu je nutno průběžně odevzdávat domácí úkoly a absolvovat závěrečný zkouškový písemný test.

Domácí úkoly

  • Úkoly budou specifikovány na hodině, zadání budou k dispozici také na webové stránce předmětu.
  • K udělení zápočtu je nutno získat celkově alespoň 50% možných bodů z úkolů.
  • Každý úkol má určený termín, do kterého musí být odevzdán. Při odevzdání úkolu se zpožděním méně než dva týdny budou získané body vyděleny dvěma. Po ještě pozdějším odevzdání úkolu za něj nebudou přiděleny žádné body.

Závěrečný písemný test

  • K absolvování zkoušky je nutno získat alespoň 50% bodů ze závěrečného zkouškového písemného testu.

Známkování

  • Celková známka vyplyne z průměru bodů získaných z domácích úkolů a ze závěrečného testu.
  • ≥ 90%: známka 1
  • ≥ 70%: známka 2
  • ≥ 50%: známka 3
  • < 50%: známka 4
Literatura -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)

Elektronické studijní materiály dodané k jednotlivým přednáškám.

Doporučená literatura nad rámec základních požadavků:

Manning C. D., Schuetze, H.: Foundations of Statistical Natural Language Processing.MIT Press, Cambridge, 1999 Koehn, P.: Statistical Machine Translation. Cambridge University Press New York, 2010.

Manning, C., Raghavan, P., Schuetze, H.: Introduction to Information Retrieval. Cambridge University Press, 2008.

Sylabus -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)
  • Motivace pro NLP. Základní pojmy pravděpodobnostního modelování a teorie informace.
  • Jazykové modely a jejich vyhlazování.
  • Skryté markovovské modely.
  • Zdroje lingvistických dat, experiment v NLP.
  • Morfologické značkování.
  • Syntaktická analýza.
  • Přehled přístupů ke strojovému překladu.
  • Statistický strojový překlad.
  • Lingvistické rysy ve strojovém překladu.
  • Vyhledávání informací.
  • Váhy termů.
  • Klasifikace a shluková analýza dokumentů.
  • Vektorové modely.