Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 336)
Detail práce
   Přihlásit přes CAS
Umělé neuronové sítě a zpětnovazebné učení
Název práce v češtině: Umělé neuronové sítě a zpětnovazebné učení
Název v anglickém jazyce: Artificial neural networks and reinforcement learning
Akademický rok vypsání: 2006/2007
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. Iveta Mrázová, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 09.03.2007
Datum zadání: 09.03.2007
Datum a čas obhajoby: 26.05.2008 00:00
Datum odevzdání elektronické podoby:26.05.2008
Datum proběhlé obhajoby: 26.05.2008
Oponenti: RNDr. Petr Božovský, CSc.
 
 
 
Zásady pro vypracování
V diplomové práci posluchač přehledově zpracuje následující témata:

- rekapitulace a srovnání různých metod vhodných pro učení umělých
neuronových sítí
- rekapitulace a vzájemné porovnání paradigmat použitelných při
zpětnovazebním učení (např. Q-učení, genetické algoritmy)
- adaptivní a automatická detekce významných vstupních parametrů.

Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných (případně simulovaných) dat navrhne vhodnou strategii pro předzpracování trénovacích dat a přistoupí k realizaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.


Seznam odborné literatury
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- T. M. Mitchell: Machine Learning, McGraw-Hill, 1997
- R. Rojas: Neural Networks: A Systematic Introduction, Springer-Verlag,
1996
- S. Haykin: Neural Networks: A Comprehensive Foundation, Prentice Hall,
Upper Saddle River, N. J., 1999

2. Články:
- S. Hochreiter, J. Schmidhuber: Long Short-Term Memory, Neural
Computation 9 (8) 1735-1780, 1997
- J. Schmidhuber: An On-Line Algorithm for Dynamic Reinforcement Learning
and Planning in Reactive Environments, in: Proc. of IEEE/INNS Int. Joint
Conf. on NN, San Diego, Vol. 2, 253-258
- G. Tesauro: Temporal Difference Learning and TD-Gammon, in:
Communications of the ACM, 1995, Vol. 38, No. 3
- R. S. Sutton, A. G. Barto: Reinforcement Learning, MIT Press, Cambridge,
MA, 1988

3. Aktuální články z profilujících světových časopisů, např.: Neurocomputing, Neural Networks, IEEE Transactions on Neural Networks ap.
 
Univerzita Karlova | Informační systém UK