PředmětyPředměty(verze: 978)
Předmět, akademický rok 2025/2026
   Přihlásit přes CAS
   
Statistické metody zpracování přirozených jazyků - NPFL147
Anglický název: Statistical Methods in Natural Language Processing
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2025
Semestr: zimní
E-Kredity: 6
Rozsah, examinace: zimní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl147
Garant: doc. RNDr. Pavel Pecina, Ph.D.
Vyučující: Mgr. Jindřich Helcl, Ph.D.
doc. RNDr. Pavel Pecina, Ph.D.
Třída: DS, matematická lingvistika
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Je záměnnost pro: NPFL068, NPFL067
Anotace -
Cílem je seznámit posluchače se základními pojmy z počítačové lingvistiky a se základy pravděpodobnostních a statistických metod pro jazykové modelování.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2025)
Podmínky zakončení předmětu -

K absolvování předmětu je zapotřebí zápočet i zkouška.

Zápočet bude udělen po splnění domácích úkolů.

Výsledná známka bude záviset na výsledcích zkoušky a řešení domácích úkolů.

Zkouška je písemnou formou a je dovoleno mít k ruce učebnici nebo kopie slajdů k přednášce nebo používat internet. Pro určení výsledné známky je váha zkoušky stejná jako váha jednoho domácího úkolu.

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2025)
Literatura -

Jurafsky, D. and J. Martin: Speech and Language Processing. Prentice Hall. 3rd edition, 2025.

Cover, T. M. and J. A. Thomas: Elements of Information Theory. Wiley. 1991. ISBN 0-471-06259-6.

Manning, C. D. and H. Schütze: Foundations of Statistical Natural Language Processing. The MIT Press. 1999. ISBN 0-262-13360-1.

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2025)
Sylabus -

1. Úvod, pravděpodobnost, základy teorie informace

2. Statistické jazykové modelování (n-gram)

3. Statistické vlastnosti slov

4. Vektorové reprezentace slov (word embeddings)

5. Skryté Markovovy modely, značkování (tagging)

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2025)
 
Univerzita Karlova | Informační systém UK