Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Cooperation with Unknown Agents in Multi-agent Environment
Thesis title in Czech: Spolupráce s neznámými agenty v multi-agentním prostředí
Thesis title in English: Cooperation with Unknown Agents in Multi-agent Environment
Key words: Zpětnovazební učení|Multiagentní systém|Spolupráce s neznámými agenty
English key words: Reinforcement Learning|Multi-Agent Systems|Ad-hoc Cooperation
Academic year of topic announcement: 2022/2023
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor: doc. Mgr. Martin Pilát, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 13.02.2023
Date of assignment: 22.02.2023
Confirmed by Study dept. on: 30.03.2023
Date and time of defence: 12.06.2023 09:00
Date of electronic submission:30.04.2023
Date of submission of printed version:09.05.2023
Date of proceeded defence: 12.06.2023
Opponents: RNDr. Milan Straka, Ph.D.
 
 
 
Guidelines
Multi-agentní zpětnovazební učení se snaží natrénovat skupiny agentů, kteří by byli schopni společně řešit zadaný problém. V posledních letech dosáhly tyto algoritmy značných úspěchů, nicméně natrénovaní agenti často umí spolupracovat pouze s agenty, se kterými byli trénováni. Cílem této práce je vytvořit algoritmy pro multiagentní zpětnovazební učení, které by uměly vytvářet agenty schopné lépe spolupracovat i s neznámými agenty.

Student prostuduje dostupnou literaturu týkající se multi-agentního zpětnovazebního učení a především spolupráce agentů, kteří spolu nebyli trénováni. Na základě získaných znalostí implementuje vlastní algoritmus pro multi-agentní zpětnovazební učení s cílem vylepšit spolupráci vytvořených agentů s novými agenty. Navržený algoritmus student vyhodnotí ve vhodném prostředí.
References
[1] Sutton, Richard S., and Andrew G. Barto. "Reinforcement learning: An introduction." MIT press, 2018. ISBN: 978-0-26-203924-6
[2] Ian Goodfellow and Yoshua Bengio and Aaron Courville. "Deep Learning." MIT Press, 2016. ISBN: 978-0-26-203561-3
[3] Strouse, D. J., Kevin McKee, Matt Botvinick, Edward Hughes, and Richard Everett. "Collaborating with humans without human data." Advances in Neural Information Processing Systems 34 (2021): 14502-14515.
[4] Carroll, Micah, Rohin Shah, Mark K. Ho, Tom Griffiths, Sanjit Seshia, Pieter Abbeel, and Anca Dragan. "On the utility of learning about humans for human-ai coordination." Advances in neural information processing systems 32 (2019).
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html