Cooperation with Unknown Agents in Multi-agent Environment
Thesis title in Czech: | Spolupráce s neznámými agenty v multi-agentním prostředí |
---|---|
Thesis title in English: | Cooperation with Unknown Agents in Multi-agent Environment |
Key words: | Zpětnovazební učení|Multiagentní systém|Spolupráce s neznámými agenty |
English key words: | Reinforcement Learning|Multi-Agent Systems|Ad-hoc Cooperation |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | doc. Mgr. Martin Pilát, Ph.D. |
Author: | hidden![]() |
Date of registration: | 13.02.2023 |
Date of assignment: | 22.02.2023 |
Confirmed by Study dept. on: | 30.03.2023 |
Date and time of defence: | 12.06.2023 09:00 |
Date of electronic submission: | 30.04.2023 |
Date of submission of printed version: | 09.05.2023 |
Date of proceeded defence: | 12.06.2023 |
Opponents: | RNDr. Milan Straka, Ph.D. |
Guidelines |
Multi-agentní zpětnovazební učení se snaží natrénovat skupiny agentů, kteří by byli schopni společně řešit zadaný problém. V posledních letech dosáhly tyto algoritmy značných úspěchů, nicméně natrénovaní agenti často umí spolupracovat pouze s agenty, se kterými byli trénováni. Cílem této práce je vytvořit algoritmy pro multiagentní zpětnovazební učení, které by uměly vytvářet agenty schopné lépe spolupracovat i s neznámými agenty.
Student prostuduje dostupnou literaturu týkající se multi-agentního zpětnovazebního učení a především spolupráce agentů, kteří spolu nebyli trénováni. Na základě získaných znalostí implementuje vlastní algoritmus pro multi-agentní zpětnovazební učení s cílem vylepšit spolupráci vytvořených agentů s novými agenty. Navržený algoritmus student vyhodnotí ve vhodném prostředí. |
References |
[1] Sutton, Richard S., and Andrew G. Barto. "Reinforcement learning: An introduction." MIT press, 2018. ISBN: 978-0-26-203924-6
[2] Ian Goodfellow and Yoshua Bengio and Aaron Courville. "Deep Learning." MIT Press, 2016. ISBN: 978-0-26-203561-3 [3] Strouse, D. J., Kevin McKee, Matt Botvinick, Edward Hughes, and Richard Everett. "Collaborating with humans without human data." Advances in Neural Information Processing Systems 34 (2021): 14502-14515. [4] Carroll, Micah, Rohin Shah, Mark K. Ho, Tom Griffiths, Sanjit Seshia, Pieter Abbeel, and Anca Dragan. "On the utility of learning about humans for human-ai coordination." Advances in neural information processing systems 32 (2019). |