PředmětyPředměty(verze: 837)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Úvod do strojového učení - NPFL054
Anglický název: Introduction to Machine Learning
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/course/npfl054
Garant: Mgr. Barbora Vidová Hladká, Ph.D.
Třída: DS, matematická lingvistika
Informatika Bc.
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Informatika, Aplikační software, Počítačová grafika a geometrie, Databázové systémy, Didaktika informatiky, Diskrétní matematika, Předměty širšího základu, Předměty obecného základu, Počítačová a formální lingvistika, Optimalizace, Programování, Softwarové inženýrství, Teoretická informatika, Počítačová a formální lingvistika
Anotace -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)
Tento úvodní kurz pokryje jak teoretické základy, tak praktické algoritmy strojového učení (SU). Probírané metody SU se neomezují na žádnou specifickou doménu a mohou být aplikovány v mnoha různých oborech. Cvičení jsou zaměřena na praktické zkušenosti s úlohami SU. Vyžadují se základní znalosti z pravděpodobnosti a statistiky a obecné programovací dovednosti.
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (09.10.2017)

Studenti musí odevzdat během semestru tři bodované domácí úkoly tak, aby jejich dosažený počet bodů překročil předem stanovený bodový limit:

  • - Maximální počet bodů: 90
  • - Požadovaný bodový limit: 65

Studenti musí napsat během semestru tři bodované testy tak, aby jejich dosažený počet bodů překročil předem stanovený bodový limit:

  • - Test1 Maximální počet bodů: 20
  • - Test2 Maximální počet bodů: 20
  • - Test3 Maximální počet bodů: 100
  • - Celkový maximální počet bodů: 140
  • - Požadovaný bodový limit: 75 pts

Získání zápočtu je podmínkou pro konání zkoušky.

Podrobnosti k domácímům úkolům a testům jsou uvedeny na webové stránce předmětu.

Literatura -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)

James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani: An Introduction to Statistical Learning. Springer, 2013.

Lantz, Brett: Machine Learning with R. Packt Publishing, 2013.

Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep Learning. MIT Press, 2016.

Požadavky ke zkoušce -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (09.10.2017)

Zkouška sestává z ústní části. Získání zápočtu je podmínkou pro konání zkoušky.

Požadavky ke zkoušce odpovídají sylabu předmětu. Podrobnosti jsou uvedené na webové stránce předmětu.

Sylabus -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)

Strojové učení - základní koncepty. Co je strojové učení, ukázky praktických aplikací, teoretické základy strojového učení. Učení s učitelem, učení bez učitele. Klasifikační a regresní úlohy. Trénovací a testovací příklady. Vektory příznaků. Cílový atribut a predikční funkce. Vývojový cyklus strojového učení. Prokletí dimenzionality. Metody shlukování.

Rozhodovací stromy. Algoritmus učení pomocí rozhodovacích stromů, kritéria větvení, prořezávání.

Lineární regrese. Metoda nejmenších čtverců.

Učení založené na příkladech. Algoritmus k-NN.

Logistická regrese. Diskriminativní klasifikátor.

Naivní Bayesův klasifikátor. Bayesovské sítě.

Metoda podpůrných vektorů. Klasifikátor pro lineárně separabilní třídy, klasifikátor pro lineárně neseparabilní třídy. Jádrové funkce. Klasifikace do více tříd.

Metody pro kombinaci více prediktorů. Bagging a boosting. Algoritmus AdaBoost. Metoda náhodných lesů.

Parametry v SU. Ladění parametrů učení. Systematické prohledávání. Metoda největšího spádu. Metoda maximální věrohodnosti.

Vyhodnocování experimentů. Práce s testovacími daty. Chyba na vzorku, generalizační chyba. Křížová validace, metoda one-leave-out. Metoda bootstrap. Míry úspěšnosti. Vyhodnocování binárních klasifikátorů. Křívka ROC.

Statistické testy. Statistické hypotézy, Jednovýběrový a dvouvýběrový t-test, chí-kvadrát test dobré shody. Hladina významnosti, p-hodnota. Použití statistických testů pro vyhodnocování klasifikátorů. Hladina spolehlivosti, intervaly spolehlivosti.

Přetrénování. Jak odhalit a zabránit. Prořezávání rozhodovacích stromů. Regularizace.

Redukce dimenze. Obecné principy výběru příznaků. Filtry, obalovací a vestavěné metody. Výběr příznaků pomocí informačního zisku. Analýza hlavních komponent.

Základy neuronových sítí. Jednoduchý perceptron. Neuronové sítě s jednou skrytou vrstvou. Zpětná propagace. Vícevrstvé dopředné modely. Poznámky k hlubokému učení.

 
Univerzita Karlova | Informační systém UK