Učení autonomních agentů
Thesis title in Czech: | Učení autonomních agentů |
---|---|
Thesis title in English: | Learning of autonomous agents |
Academic year of topic announcement: | 2012/2013 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | doc. RNDr. Iveta Mrázová, CSc. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 31.10.2012 |
Date of assignment: | 31.10.2012 |
Confirmed by Study dept. on: | 14.12.2012 |
Guidelines |
V diplomové práci posluchač přehledově zpracuje následující témata:
- rekapitulace a srovnání různých paradigmat učení, zejména učení s učitelem, učení bez učitele, učení s neúplnou informací o požadovaných výstupech (semi-supervised learning) - rekapitulace a vzájemné porovnání technik použitelných pro učení autonomních agentů, např. neuronové sítě, evoluční strategie, zpětnovazebné učení - analýza známých (hybridních) modelů vhodných pro řízení autonomních agentů Na některé z uvedených témat se diplomant zaměří detailněji a navrhne vlastní hybridní systém pro řízení autonomních agentů (pravděpodobně robotických). Navržený systém student implementuje a otestuje na reálných (případně simulovaných) datech. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností. |
References |
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997 - B. Liu: Web Data Mining, Springer-Verlag, 2007 - S. Haykin: Neural Networks and Learning Machines, 3rd edition, Pearson, 2009 2. Články: - V. Graziano, J. Koutnik, J. Schmidhuber. Unsupervised Modeling of Partially Observable Environments, in: Proc. of 22nd European Conference on Machine Learning ECML, Athens, 2011. - S. Sandow, J. Zhou: Data-efficient model building for financial applications: a semi-supervised learning approach, in: Journal of Risk Finance, volume 8(2), pages 133-155, 2007. - J. Schmidhuber. An on-line algorithm for dynamic reinforcement learning and planning in reactive environments, in: Proc. of IEEE/INNS International Joint Conference on Neural Networks, San Diego, volume 2, pages 253-258, 1990. - R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge, MA, 1988. - G. Tesauro: Temporal Difference Learning and TD-Gammon, in: Communications of the ACM, 1995, Vol. 38, No. 3. 3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap. |