Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Učení autonomních agentů
Thesis title in Czech: Učení autonomních agentů
Thesis title in English: Learning of autonomous agents
Academic year of topic announcement: 2012/2013
Thesis type: diploma thesis
Thesis language: čeština
Department: Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor: doc. RNDr. Iveta Mrázová, CSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 31.10.2012
Date of assignment: 31.10.2012
Confirmed by Study dept. on: 14.12.2012
Guidelines
V diplomové práci posluchač přehledově zpracuje následující témata:

- rekapitulace a srovnání různých paradigmat učení, zejména učení s učitelem,
učení bez učitele, učení s neúplnou informací o požadovaných výstupech
(semi-supervised learning)

- rekapitulace a vzájemné porovnání technik použitelných pro učení
autonomních agentů, např. neuronové sítě, evoluční strategie, zpětnovazebné
učení

- analýza známých (hybridních) modelů vhodných pro řízení autonomních agentů

Na některé z uvedených témat se diplomant zaměří detailněji a navrhne vlastní
hybridní systém pro řízení autonomních agentů (pravděpodobně robotických).
Navržený systém student implementuje a otestuje na reálných (případně simulovaných)
datech. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.

References
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997
- B. Liu: Web Data Mining, Springer-Verlag, 2007
- S. Haykin: Neural Networks and Learning Machines, 3rd edition, Pearson,
2009

2. Články:
- V. Graziano, J. Koutnik, J. Schmidhuber. Unsupervised Modeling of Partially
Observable Environments, in: Proc. of 22nd European Conference on Machine
Learning ECML, Athens, 2011.
- S. Sandow, J. Zhou: Data-efficient model building for financial applications:
a semi-supervised learning approach, in: Journal of Risk Finance, volume 8(2),
pages 133-155, 2007.
- J. Schmidhuber. An on-line algorithm for dynamic reinforcement learning and
planning in reactive environments, in: Proc. of IEEE/INNS International Joint
Conference on Neural Networks, San Diego, volume 2, pages 253-258, 1990.
- R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge,
MA, 1988.
- G. Tesauro: Temporal Difference Learning and TD-Gammon, in:
Communications of the ACM, 1995, Vol. 38, No. 3.

3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing,
Neural Networks, IEEE Transactions on Neural Networks ap.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html