PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Úvod do strojového učení pro zpracování přirozeného jazyka - NPFL113
Anglický název: Introduction to Machine Learning in Natural Language Processing
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: zimní
E-Kredity: 6
Rozsah, examinace: zimní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: zrušen
Jazyk výuky: angličtina, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: RNDr. Martin Holub, Ph.D.
doc. Mgr. Barbora Vidová Hladká, Ph.D.
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: G_I (26.05.2015)
Tento jednosemestrální úvodní kurz je určen výhradně pro studenty studující v anglickém jazyce. Cílem kurzu je představit teoretické základy a základní algoritmy strojového učení. Výuka může být přizpůsobena potřebám a vzdělání přihlášených studentů. Předpokládáme základní znalost pravděpodobnosti a statistiky. Pro studenty se slabšími matematickými základy je určen podpůrný kurz NPFL081. Cvičení jsou aplikačně závislá a jejich cílem je získání praktických zkušeností s aplikací strojového učení v oblasti počítačového zpracování přirozeného jazyka.
Podmínky zakončení předmětu -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (14.11.2019)

Ústní zkouška, povinný písemný test. Získání zápočtu je podmínkou pro konání zkoušky. Viz detaily požadavků v sylabus.

Literatura -
Poslední úprava: G_I (26.05.2015)

● Hladká Barbora, Holub Martin: A Gentle Introduction to Machine Learning for Natural Language Processing: How to start in 16 practical steps. In: Language and Linguistics Compass, Vol. 9, No. 2, pp. 55-76, 2015.

● Lantz, Brett: Machine Learning with R. Packt Publishing, 2013.

● James, Gareth, Daniela Witten, Trevor Hastie and Robert Tibshirani: An Introduction to Statistical Learning. Springer, 2013.

Požadavky ke zkoušce -
Poslední úprava: RNDr. Martin Holub, Ph.D. (13.06.2019)

Řízené a neřízené učení, konstrukce příznaků, přetrénování. Příprava dat, mezianotátorská shoda. Vyhodnocení experimentů, křížová validace, odhad chyby, bootstrapping, statistická významnost, intervaly spolehlivosti. Výběr modelu. Rozhodovací stromy. Naivní Bayesův klasifikátor. Učení založené na příkladech, algoritmus k-NN. Prokletí dimenzionality. Metoda podpůrných vektorů, lineární a nelineární separace, kernelové funkce. Kombinace metod, hlasování, bagging, boosting, AdaBoost, náhodné lesy. Logistická regrese. Shluková analýza, algoritmus K-means.

Sylabus -
Poslední úprava: G_I (26.05.2015)

Úvod do strojového učení a jeho aplikací v NLP. Řízené a neřízené učení, konstrukce příznaků, přetrénování. Příprava dat, mezianotátorská shoda. Vyhodnocení experimentů, křížová validace, odhad chyby, bootstrapping, statistická významnost, intervaly spolehlivosti. Výběr modelu. Rozhodovací stromy. Naivní Bayesův klasifikátor. Učení založené na příkladech, algoritmus k-NN. Prokletí dimenzionality. Metoda podpůrných vektorů, lineární a nelineární separace, kernelové funkce. Kombinace metod, hlasování, bagging, boosting, AdaBoost, náhodné lesy. Logistická regrese. Shluková analýza, algoritmus K-means.

 
Univerzita Karlova | Informační systém UK