PředmětyPředměty(verze: 804)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Úvod do strojového učení - NPFL054
Anglický název: Introduction to Machine Learning
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2014
Semestr: zimní
E-Kredity: 6
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/course/npfl054
Garant: Mgr. Barbora Vidová Hladká, Ph.D.
RNDr. Martin Holub, Ph.D.
Třída: DS, matematická lingvistika
Informatika Bc.
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Informatika, Aplikační software, Počítačová grafika a geometrie, Databázové systémy, Didaktika informatiky, Diskrétní matematika, Předměty širšího základu, Předměty obecného základu, Počítačová a formální lingvistika, Optimalizace, Programování, Softwarové inženýrství, Teoretická informatika, Počítačová a formální lingvistika
Anotace -
Poslední úprava: T_UFAL (28.04.2015)

Přednáška (svým obsahem úvodní) pokryje teoretické základy a základní algoritmy strojového učení (SU) nezávisle na širokém spektru mezioborových aplikací, ve kterých SU našlo své místo. Cvičení jsou aplikačně závislá - věnujeme se zvládnutí přístupů SU použitých v úlohách z různých oblastí. Přednáška je určena studentům bakalářského studia všech oborů MFF. Předpokládají se základní znalosti z pravděpodobnosti a statistiky. Přednáška se koná buď v českém nebo v anglickém jazyce, dle zájmu studentů.
Literatura -
Poslední úprava: T_UFAL (28.04.2015)

• Mitchel, Tom: Machine Learning. McGraw-Hill, 1997.

• James, Gareth, Daniela Witten, Trevor Hastie and Robert Tibshirani: An Introduction to Statistical Learning. Springer, 2013.

• Lantz, Brett: Machine Learning with R. Packt Publishing, 2013.

Sylabus -
Poslední úprava: T_UFAL (10.05.2017)

1. Úvod: co je strojové učení, motivační příklady, interdisciplinarita strojového učení, řízené vs. neřízené učení, strojové učení a jeho aplikace.

2. Rozhodovací stromy: rozhodovací strom jako datová struktura, algoritmus ID3, kritéria větvení, spojité atributy, chybějící atributy.

3. Naivní Bayesův klasifikátor: Bayesův vzorec, posteriorní pravděpodobnost, metoda maximální věrohodnosti. Bayesovské sítě, algoritmus K2.

4. Vyhodnocení experimentů: přesnost, křížová validace, odhad chyby, bootstrapping, křivka ROC, statistická významnost výsledků, intervaly spolehlivosti.

5. Lineární a logistická regrese.

6. Učení založené na příkladech: kritérium vzdálenosti, algoritmus K nejbližších sousedů, diskrétní/spojité případy, prokletí dimenzionality.

7. Metoda podpůrných vektorů: hranice lineárního oddělovače (klasifikátoru), (ne)lineární oddělovač, jádrové algoritmy.

8. Přetrénování, regularizace.

9. Kombinace klasifikátorů: hlasování, bagging, boosting, AdaBoost, metoda náhodných lesů.

10. Shlukování: dendrogramy, (ne)hierarchické shlukování, algoritmus K průměrů.

11. Základy neuronových sítí.

 
Univerzita Karlova | Informační systém UK