PředmětyPředměty(verze: 861)
Předmět, akademický rok 2019/2020
  
Strojové učení pro zelenáče - NPFL129
Anglický název: Machine Learning for Greenhorns
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2019
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Další informace: http://ufal.mff.cuni.cz/courses/npfl129
Garant: RNDr. Milan Straka, Ph.D.
Anotace -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)
Strojové učení dosahuje značných úspěchů při řešení komplexních úloh v mnoha oborech. Tento předmět slouží jako úvodní kurz pro seznámení se strojovým učením, a to jak s teoretickými základy, tak s implementací a použitím algoritmů strojového učení, a to v jazyce Python. Důraz je kladen na schopnosti aplikace popisovaných technik při řešení praktických úloh, ve kterých se studenti snaží dosáhnout řešení s nejvyšší přesností.
Cíl předmětu -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)

Cílem přednášky je seznámení se strojovým učením. Předmět se zaměří jak na teorii, tak na schopnosti implementace algoritmů strojového učení a aplikace technik strojového učení na praktických úlohách, a to v jazyce Python.

Podmínky zakončení předmětu -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)

Zápočet je udělován za vypracování dostatečného množství úloh. Úlohy jsou zadávány pravidelně celý semestr a na vypracování každé z nich je několik týdnů. Vzhledem ke způsobu obdržení zápočtu není možné jeho získání opakovat. Získání zápočtu není podmínkou k připuštění ke zkoušce.

Literatura -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)
  • Christopher M. Bishop: Pattern Recognition and Machine Learning. Springer Verlag. 2006.
  • James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani: An Introduction to Statistical Learning. Springer, 2013.

Požadavky ke zkoušce -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)

Zkouška sestává z písemné části a z nepovinné ústní části, kde studenti mohou reagovat na dotazy ke svému řešení a odpovídat na doplňující otázky.

Požadavky zkoušky odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce.

Sylabus -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)

Základní pojmy strojového učení

  • učení s učitelem a bez učitele, zpětnovazební učení
  • trénování, generalizace, přeučení, regularizace
  • datová distribuce, trénovací/validační/testovací data

Úlohy strojového učení

  • regrese (rozhodovací stromy, lineární regrese)
  • binární klasifikace (rozhodovací stromy, logistická regrese, SVM [hard-margin, soft-margin, kernel trick], perceptron)
  • obecná klasifikace (rozhodovací stromy, one-against-all, multinomiální logistická regrese [maximum entropy/softmax klasifikátor])
  • strukturovaná predikce (CRF)
  • shluková analýza

Trénování

  • příprava dat
  • regularizace
  • volba hyperparametrů pomocí Bayesovské optimalizace

Vyhodnocování

  • metriky (úspěšnost, precision, recall, F-skóre, IoU, ROC a precision-recall křivky)
  • statistické testy a statistická významnost

Kombinace modelů

  • voting, ensembling, boosting

Vstupní požadavky -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (15.05.2019)

Je vyžadována základní znalost programování v jazyce Python a základní znalost pravděpodobnosti a statistiky.

 
Univerzita Karlova | Informační systém UK