Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Učení autonomních agentů

Thesis title in Czech:	Učení autonomních agentů
Thesis title in English:	Learning of autonomous agents
Academic year of topic announcement:	2012/2013
Thesis type:	diploma thesis
Thesis language:	čeština
Department:	Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor:	doc. RNDr. Iveta Mrázová, CSc.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	31.10.2012
Date of assignment:	31.10.2012
Confirmed by Study dept. on:	14.12.2012

Guidelines

V diplomové práci posluchač přehledově zpracuje následující témata:

- rekapitulace a srovnání různých paradigmat učení, zejména učení s učitelem,
učení bez učitele, učení s neúplnou informací o požadovaných výstupech
(semi-supervised learning)

- rekapitulace a vzájemné porovnání technik použitelných pro učení
autonomních agentů, např. neuronové sítě, evoluční strategie, zpětnovazebné
učení

- analýza známých (hybridních) modelů vhodných pro řízení autonomních agentů

Na některé z uvedených témat se diplomant zaměří detailněji a navrhne vlastní
hybridní systém pro řízení autonomních agentů (pravděpodobně robotických).
Navržený systém student implementuje a otestuje na reálných (případně simulovaných)
datech. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.

References

1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997
- B. Liu: Web Data Mining, Springer-Verlag, 2007
- S. Haykin: Neural Networks and Learning Machines, 3rd edition, Pearson,
2009

2. Články:
- V. Graziano, J. Koutnik, J. Schmidhuber. Unsupervised Modeling of Partially
Observable Environments, in: Proc. of 22nd European Conference on Machine
Learning ECML, Athens, 2011.
- S. Sandow, J. Zhou: Data-efficient model building for financial applications:
a semi-supervised learning approach, in: Journal of Risk Finance, volume 8(2),
pages 133-155, 2007.
- J. Schmidhuber. An on-line algorithm for dynamic reinforcement learning and
planning in reactive environments, in: Proc. of IEEE/INNS International Joint
Conference on Neural Networks, San Diego, volume 2, pages 253-258, 1990.
- R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge,
MA, 1988.
- G. Tesauro: Temporal Difference Learning and TD-Gammon, in:
Communications of the ACM, 1995, Vol. 38, No. 3.

3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing,
Neural Networks, IEEE Transactions on Neural Networks ap.