|
|
|
||
V posledních letech došlo ke zkombinování zpětnovazebního učení a hlubokých neuronových sítí, což umožnilo vytvoření agentů s nadlidskou výkonností (kupříkladu pro šachy, go, Dota2 či StarcraftII, schopných natrénovaní pouze z her „sám se sebou“),
algoritmů pro řízení chlazení datacenter o 50% efektivnější než lidští operátoři, nebo vylepšeného strojového překladu. Cílem přednášky je seznámení se zpětnovazebním učením využívajícím hluboké neuronové sítě, se zaměřením jak na teorii, tak na
skutečnou implementaci.
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (25.01.2019)
|
|
||
Cílem přednášky je seznámení se zpětnovazebním učením zkombinovaným s hlubokými neuronovými sítěmi. Přednáška se zaměří jak na teorii, tak na skutečné použití zpětnovazebního učení. Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (05.06.2018)
|
|
||
Zápočet je udělován za vypracování dostatečného množství úloh. Úlohy jsou zadávány pravidelně celý semestr a na vypracování každé z nich je několik týdnů. Vzhledem ke způsobu obdržení zápočtu není možné jeho získání opakovat. Získání zápočtu není podmínkou k připuštění ke zkoušce. Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (05.06.2018)
|
|
||
Poslední úprava: Straka Milan, RNDr., Ph.D. (10.05.2022)
|
|
||
Zkouška je písemná a skládá se z náhodně volených otázek z předem známého seznamu. Požadavky zkoušky odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce. Poslední úprava: Straka Milan, RNDr., Ph.D. (15.06.2020)
|
|
||
Základní rámec zpětnovazebního učení
Tabulkové metody
Functionální aproximace
Hluboké Q sítě
Policy gradient metody
Doména spojitých akcí
Prohledávání Monte Carlo tree search
Algoritmy využívající modely
Částečně pozorovatelná prostředí
Optimalizace diskrétních proměnných Poslední úprava: Straka Milan, RNDr., Ph.D. (10.05.2022)
|
|
||
Je vyžadována znalost jazyka Python a frameworku TensorFlow (nebo obdobného frameworku pro práci s hlubokými sítěmi), v rozsahu přednášky NPFL114. Předchozí znalosti zpětnovazebního učení nejsou nutné. Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (05.06.2018)
|