Thesis (Selection of subject)Thesis (Selection of subject)(version: 392)
Thesis details
   Login via CAS
Umělé neuronové sítě a zpětnovazebné učení
Thesis title in Czech: Umělé neuronové sítě a zpětnovazebné učení
Thesis title in English: Artificial neural networks and reinforcement learning
Academic year of topic announcement: 2006/2007
Thesis type: diploma thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. Iveta Mrázová, CSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 09.03.2007
Date of assignment: 09.03.2007
Date and time of defence: 26.05.2008 00:00
Date of electronic submission:26.05.2008
Date of proceeded defence: 26.05.2008
Opponents: RNDr. Petr Božovský, CSc.
 
 
 
Guidelines
V diplomové práci posluchač přehledově zpracuje následující témata:

- rekapitulace a srovnání různých metod vhodných pro učení umělých
neuronových sítí
- rekapitulace a vzájemné porovnání paradigmat použitelných při
zpětnovazebním učení (např. Q-učení, genetické algoritmy)
- adaptivní a automatická detekce významných vstupních parametrů.

Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných (případně simulovaných) dat navrhne vhodnou strategii pro předzpracování trénovacích dat a přistoupí k realizaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.


References
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997
- R. Rojas: Neural Networks: A Systematic Introduction, Springer-Verlag,
1996
- S. Haykin: Neural Networks: A Comprehensive Foundation, Prentice Hall,
Upper Saddle River, N. J., 1999

2. Články:
- S. Hochreiter, J. Schmidhuber: Long Short-Term Memory, Neural
Computation 9 (8) 1735-1780, 1997
- J. Schmidhuber: An On-Line Algorithm for Dynamic Reinforcement Learning
and Planning in Reactive Environments, in: Proc. of IEEE/INNS Int. Joint
Conf. on NN, San Diego, Vol. 2, 253-258
- G. Tesauro: Temporal Difference Learning and TD-Gammon, in:
Communications of the ACM, 1995, Vol. 38, No. 3
- R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge,
MA, 1988

3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html