|
|
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (16.03.2024)
|
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (11.05.2023)
Cílem přednášky je seznámení se zpětnovazebním učením zkombinovaným s hlubokými neuronovými sítěmi. Přednáška se zaměří jak na teorii, tak na skutečné použití zpětnovazebního učení. |
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (11.05.2023)
Zápočet je udělován za vypracování dostatečného množství úloh. Úlohy jsou zadávány pravidelně celý semestr a na vypracování každé z nich je několik týdnů. Vzhledem ke způsobu obdržení zápočtu není možné jeho získání opakovat. Získání zápočtu není podmínkou k připuštění ke zkoušce. |
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (11.05.2023)
|
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (11.05.2023)
Zkouška je písemná a skládá se z náhodně volených otázek z předem známého seznamu. Požadavky zkoušky odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce. |
|
||
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (11.05.2023)
Základní rámec zpětnovazebního učení
Tabulkové metody
Functionální aproximace
Hluboké Q sítě
Policy gradient metody
Doména spojitých akcí
Prohledávání Monte Carlo tree search
Algoritmy využívající modely
Částečně pozorovatelná prostředí
Optimalizace diskrétních proměnných |
|
||
Poslední úprava: RNDr. Milan Straka, Ph.D. (09.11.2023)
Je vyžadována znalost jazyka Python a základní znalost PyTorch/TensorFlow (tu je možné získat na předmětu Hluboké učení NPFL138). Předchozí znalosti zpětnovazebního učení nejsou nutné. |