Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Umělé neuronové sítě a zpětnovazebné učení

Thesis title in Czech:	Umělé neuronové sítě a zpětnovazebné učení
Thesis title in English:	Artificial neural networks and reinforcement learning
Academic year of topic announcement:	2006/2007
Thesis type:	diploma thesis
Thesis language:	čeština
Department:	Department of Software Engineering (32-KSI)
Supervisor:	doc. RNDr. Iveta Mrázová, CSc.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	09.03.2007
Date of assignment:	09.03.2007
Date and time of defence:	26.05.2008 00:00
Date of electronic submission:	26.05.2008
Date of proceeded defence:	26.05.2008
Opponents:	RNDr. Petr Božovský, CSc.

Guidelines

V diplomové práci posluchač přehledově zpracuje následující témata:

- rekapitulace a srovnání různých metod vhodných pro učení umělých
neuronových sítí
- rekapitulace a vzájemné porovnání paradigmat použitelných při
zpětnovazebním učení (např. Q-učení, genetické algoritmy)
- adaptivní a automatická detekce významných vstupních parametrů.

Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných (případně simulovaných) dat navrhne vhodnou strategii pro předzpracování trénovacích dat a přistoupí k realizaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.

References

1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997
- R. Rojas: Neural Networks: A Systematic Introduction, Springer-Verlag,
1996
- S. Haykin: Neural Networks: A Comprehensive Foundation, Prentice Hall,
Upper Saddle River, N. J., 1999

2. Články:
- S. Hochreiter, J. Schmidhuber: Long Short-Term Memory, Neural
Computation 9 (8) 1735-1780, 1997
- J. Schmidhuber: An On-Line Algorithm for Dynamic Reinforcement Learning
and Planning in Reactive Environments, in: Proc. of IEEE/INNS Int. Joint
Conf. on NN, San Diego, Vol. 2, 253-258
- G. Tesauro: Temporal Difference Learning and TD-Gammon, in:
Communications of the ACM, 1995, Vol. 38, No. 3
- R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge,
MA, 1988

3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap.