Cooperative Multi-Agent Reinforcement Learning
Název práce v češtině: | Zpětnovazební učení pro kooperaci více agentů |
---|---|
Název v anglickém jazyce: | Cooperative Multi-Agent Reinforcement Learning |
Klíčová slova: | Zpětnovazební učení|Multiagentní systémy|Hluboké učení |
Klíčová slova anglicky: | Reinforcement Learning|Multi-Agent Systems|Deel Learning |
Akademický rok vypsání: | 2020/2021 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra teoretické informatiky a matematické logiky (32-KTIML) |
Vedoucí / školitel: | Mgr. Martin Pilát, Ph.D. |
Řešitel: | Mgr. Jan Uhlík - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 11.01.2021 |
Datum zadání: | 13.01.2021 |
Datum potvrzení stud. oddělením: | 02.02.2021 |
Datum a čas obhajoby: | 22.06.2021 09:00 |
Datum odevzdání elektronické podoby: | 16.05.2021 |
Datum odevzdání tištěné podoby: | 21.05.2021 |
Datum proběhlé obhajoby: | 22.06.2021 |
Oponenti: | RNDr. Milan Straka, Ph.D. |
Zásady pro vypracování |
Zpětnovazební učení zažívá v posledních letech výrazný rozmach díky novým technikám založených na hlubokém učení. Zajímavou oblastí výzkumu je jeho využití v prostředích s více agenty. Cílem práce je prozkoumat a navrhnout nové metody pro zpětnovazební učení se zaměřením na kooperaci agentů.
Student prostuduje dostupnou literaturu o zpětnovazebním učení a na základě těchto informací vybere vhodná prostředí a problémy pro otestování multiagentního zpětnovazebního učení. Prostředí by měla být jak kooperativní, kde skupina agentů společně řeší daný problém, tak smíšená, kde proti sobě například stojí dvě skupiny agentů. V těchto prostředích následně student implementuje nové algoritmy pro zpětnovazební učení a porovná je s algoritmy existujícími. |
Seznam odborné literatury |
[1] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
[2] Wooldridge, Michael. An introduction to multiagent systems. John Wiley & Sons, 2009. [3] Gupta, Jayesh K., Maxim Egorov, and Mykel Kochenderfer. "Cooperative multi-agent control using deep reinforcement learning." In International Conference on Autonomous Agents and Multiagent Systems, pp. 66-83. Springer, Cham, 2017. [4] Lowe, Ryan, Yi I. Wu, Aviv Tamar, Jean Harb, OpenAI Pieter Abbeel, and Igor Mordatch. "Multi-agent actor-critic for mixed cooperative-competitive environments." In Advances in neural information processing systems, pp. 6379-6390. 2017. |