|
|
|
||
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2019)
|
|
||
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (05.06.2018)
Cílem přednášky je seznámení se zpětnovazebním učením zkombinovaným s hlubokými neuronovými sítěmi. Přednáška se zaměří jak na teorii, tak na skutečné použití zpětnovazebního učení. |
|
||
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (05.06.2018)
Zápočet je udělován za vypracování dostatečného množství úloh. Úlohy jsou zadávány pravidelně celý semestr a na vypracování každé z nich je několik týdnů. Vzhledem ke způsobu obdržení zápočtu není možné jeho získání opakovat. Získání zápočtu není podmínkou k připuštění ke zkoušce. |
|
||
Poslední úprava: RNDr. Milan Straka, Ph.D. (10.05.2022)
|
|
||
Poslední úprava: RNDr. Milan Straka, Ph.D. (15.06.2020)
Zkouška je písemná a skládá se z náhodně volených otázek z předem známého seznamu. Požadavky zkoušky odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce. |
|
||
Poslední úprava: RNDr. Milan Straka, Ph.D. (10.05.2022)
Základní rámec zpětnovazebního učení
Tabulkové metody
Functionální aproximace
Hluboké Q sítě
Policy gradient metody
Doména spojitých akcí
Prohledávání Monte Carlo tree search
Algoritmy využívající modely
Částečně pozorovatelná prostředí
Optimalizace diskrétních proměnných |
|
||
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (05.06.2018)
Je vyžadována znalost jazyka Python a frameworku TensorFlow (nebo obdobného frameworku pro práci s hlubokými sítěmi), v rozsahu přednášky NPFL114. Předchozí znalosti zpětnovazebního učení nejsou nutné. |