Umělé neuronové sítě a zpětnovazebné učení
| Thesis title in Czech: | Umělé neuronové sítě a zpětnovazebné učení |
|---|---|
| Thesis title in English: | Artificial neural networks and reinforcement learning |
| Academic year of topic announcement: | 2006/2007 |
| Thesis type: | diploma thesis |
| Thesis language: | čeština |
| Department: | Department of Software Engineering (32-KSI) |
| Supervisor: | doc. RNDr. Iveta Mrázová, CSc. |
| Author: | hidden - assigned and confirmed by the Study Dept. |
| Date of registration: | 09.03.2007 |
| Date of assignment: | 09.03.2007 |
| Date and time of defence: | 26.05.2008 00:00 |
| Date of electronic submission: | 26.05.2008 |
| Date of proceeded defence: | 26.05.2008 |
| Opponents: | RNDr. Petr Božovský, CSc. |
| Guidelines |
| V diplomové práci posluchač přehledově zpracuje následující témata:
- rekapitulace a srovnání různých metod vhodných pro učení umělých neuronových sítí - rekapitulace a vzájemné porovnání paradigmat použitelných při zpětnovazebním učení (např. Q-učení, genetické algoritmy) - adaptivní a automatická detekce významných vstupních parametrů. Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných (případně simulovaných) dat navrhne vhodnou strategii pro předzpracování trénovacích dat a přistoupí k realizaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností. |
| References |
| 1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997 - R. Rojas: Neural Networks: A Systematic Introduction, Springer-Verlag, 1996 - S. Haykin: Neural Networks: A Comprehensive Foundation, Prentice Hall, Upper Saddle River, N. J., 1999 2. Články: - S. Hochreiter, J. Schmidhuber: Long Short-Term Memory, Neural Computation 9 (8) 1735-1780, 1997 - J. Schmidhuber: An On-Line Algorithm for Dynamic Reinforcement Learning and Planning in Reactive Environments, in: Proc. of IEEE/INNS Int. Joint Conf. on NN, San Diego, Vol. 2, 253-258 - G. Tesauro: Temporal Difference Learning and TD-Gammon, in: Communications of the ACM, 1995, Vol. 38, No. 3 - R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge, MA, 1988 3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap. |
- assigned and confirmed by the Study Dept.