Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Použití neuronových sítí pro automatické rozpoznávání řeči
Název práce v češtině: Použití neuronových sítí pro automatické rozpoznávání řeči
Název v anglickém jazyce: Neural networks for automatic speech recognition
Klíčová slova: automatické rozpoznávání řeči, ASR, neuronové sítě, convoluční neuronové sítě, CNN, rekurentní neuronové sítě, RNN, LSTM
Klíčová slova anglicky: automatic speech recognition, ASR, neural networks, convolutional neural networks, CNN, recurent neural networks, RNN, long short term memory networks, LSTM
Akademický rok vypsání: 2016/2017
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Ing. Filip Jurčíček, Ph.D.
Řešitel:
Zásady pro vypracování
V poslední době, zejména díky využití výpočetních prostředků založených na GPU, se ukázalo, že neuronové sítě poskytují jedny z nejlepších výsledků v mnoha úlohách strojového učení. Cílem této práci je využití konvolučních a rekurentních neuronových sítí pro automatické rozpoznávání řeči. Pro tuto práci má moje skupinu k dispozici GPU karty NVIDIA Tesla K40 (cca. 2800 jader, 12 GB RAM) a NVIDIA GeForce Titan Z (cca. 5600 jader, 12 GB RAM). Hlavním cílem je vylepšení dialogového systému vyvíjeného v mé skupině popsaného na https://ufal.mff.cuni.cz/alex a dostupného na tel. čísle 800 899 998. Více o diplomových racích je na http://ufal.mff.cuni.cz/filip-jurcicek/theses-proposals.
Seznam odborné literatury
Psutka, J. and Müller, L. and Matoušek, J. and Radová, V. : Mluvíme s počítačem česky. p. 752, Academia, Prague, 2006.
C. M. Bishop, Pattern Recognition and Machine Learning, vol. 4, no. 4. Springer, 2006, p. 738.
F. Jurcicek, B. Thomson, S. Young (2011) "Reinforcement learning for parameter estimation in statistical spoken dialogue systems". Computer Speech and Language
B. Thomson and S.Young (2010). "Bayesian update of dialogue state: A POMDP framework for spoken dialogue systems." Computer Speech and Language.
S. Young, M. Gasic, S. Keizer, F. Mairesse, J. Schatzmann, B. Thomson and K. Yu (2010). "The Hidden Information State Model: a practical framework for POMDP-based spoken dialogue management." Computer Speech and Language.
B. Thomson (2009). "Statistical methods for spoken dialogue management." Ph.D. Thesis. University of Cambridge.
 
Univerzita Karlova | Informační systém UK