Umělé neuronové sítě a zpětnovazebné učení
| Název práce v češtině: | Umělé neuronové sítě a zpětnovazebné učení |
|---|---|
| Název v anglickém jazyce: | Artificial neural networks and reinforcement learning |
| Akademický rok vypsání: | 2006/2007 |
| Typ práce: | diplomová práce |
| Jazyk práce: | čeština |
| Ústav: | Katedra softwarového inženýrství (32-KSI) |
| Vedoucí / školitel: | doc. RNDr. Iveta Mrázová, CSc. |
| Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
| Datum přihlášení: | 09.03.2007 |
| Datum zadání: | 09.03.2007 |
| Datum a čas obhajoby: | 26.05.2008 00:00 |
| Datum odevzdání elektronické podoby: | 26.05.2008 |
| Datum proběhlé obhajoby: | 26.05.2008 |
| Oponenti: | RNDr. Petr Božovský, CSc. |
| Zásady pro vypracování |
| V diplomové práci posluchač přehledově zpracuje následující témata:
- rekapitulace a srovnání různých metod vhodných pro učení umělých neuronových sítí - rekapitulace a vzájemné porovnání paradigmat použitelných při zpětnovazebním učení (např. Q-učení, genetické algoritmy) - adaptivní a automatická detekce významných vstupních parametrů. Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných (případně simulovaných) dat navrhne vhodnou strategii pro předzpracování trénovacích dat a přistoupí k realizaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností. |
| Seznam odborné literatury |
| 1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997 - R. Rojas: Neural Networks: A Systematic Introduction, Springer-Verlag, 1996 - S. Haykin: Neural Networks: A Comprehensive Foundation, Prentice Hall, Upper Saddle River, N. J., 1999 2. Články: - S. Hochreiter, J. Schmidhuber: Long Short-Term Memory, Neural Computation 9 (8) 1735-1780, 1997 - J. Schmidhuber: An On-Line Algorithm for Dynamic Reinforcement Learning and Planning in Reactive Environments, in: Proc. of IEEE/INNS Int. Joint Conf. on NN, San Diego, Vol. 2, 253-258 - G. Tesauro: Temporal Difference Learning and TD-Gammon, in: Communications of the ACM, 1995, Vol. 38, No. 3 - R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge, MA, 1988 3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap. |
- zadáno a potvrzeno stud. odd.