Teorie posilovaného učení vychází z poznatků o chování racionálních agentů v proměnném prostředí a zasazuje je do kontextu strojového učení, teorie řízení a statistické teorie
rozhodování. Algoritmy posilovaného učení nacházejí uplatnění od řízení fyzikálních systémů po návrh strategií pro hraní počítačových her.
Poslední úprava: RNDr. Jan Hric (27.04.2018)
The theory of Reinforcement Learning (RL) is motivated by results about the rational behavior of agents in dynamic environments and
relates them to the context of machine learning, control theory, and statistical decision theory. The RL algorithms are applied in various
fields, including control of physical systems or playing computer games.
Cíl předmětu -
Poslední úprava: RNDr. Jan Hric (27.04.2018)
Uvést studenty do problematiky posilovaného učení, seznámit je s důležitými pojmy, základními algoritmy a umožnit jejich základní procvičení v jazyce Python.
Poslední úprava: RNDr. Jan Hric (27.04.2018)
To introduce the reinforcement learning principles and concepts, to explain fundamental algorithms, and practice them in Python.
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Jan Hric (27.04.2018)
Je třeba získat zápočet a složit zkoušku (v libovolném pořadí). Zápočet se uděluje za řešení domácích úkolů a případných dodatečných úkolů na konci semestru. Povaha kontroly podmínek k udělení zápočtu vylučuje možnost jejího opakování, což znamená, že když nenasbíráte dostatek bodů, zápočet nelze získat jinak.
Zkouška se skládá z písemné a ústní části. Písemná část předchází části ústní, její nesplnění znamená, že termín zkoušky je hodnocen známkou nevyhověl(a) a ústní částí se již nepokračuje.
Poslední úprava: RNDr. Jan Hric (27.04.2018)
It is necessary to get course credit and pass the examination (in arbitrary order). Credit is given for solving homework, including potential additional homework at the end of the semester. The nature of this requirement excludes the possibility of repeated attempts to get credit, which means that if you do not obtain enough points for homework, there is no other way how to get credit.
The examination consists of a written and oral part. The written part precedes the oral part, a failure in the written part implies failing the whole exam, so the oral part is skipped in such cases.
Literatura -
Poslední úprava: RNDr. Jan Hric (09.05.2018)
Richard S. Sutton, Andrew G. Barto. Reinforcement learning: An introduction. Vol. 1. No. 1. Cambridge: MIT Press, 1998.
Busoniu, L., Babuska, R., De Schutter, B., & Ernst, D. (2010). Reinforcement learning and dynamic programming using function approximators (Vol. 39). CRC press.
Poslední úprava: RNDr. Jan Hric (09.05.2018)
Richard S. Sutton, Andrew G. Barto. Reinforcement learning: An introduction. Vol. 1. No. 1. Cambridge: MIT Press, 1998.
Busoniu, L., Babuska, R., De Schutter, B., & Ernst, D. (2010). Reinforcement learning and dynamic programming using function approximators (Vol. 39). CRC press.