Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Použití neuronových sítí pro automatické rozpoznávání řeči
Thesis title in Czech: Použití neuronových sítí pro automatické rozpoznávání řeči
Thesis title in English: Neural networks for automatic speech recognition
Key words: automatické rozpoznávání řeči, ASR, neuronové sítě, convoluční neuronové sítě, CNN, rekurentní neuronové sítě, RNN, LSTM
English key words: automatic speech recognition, ASR, neural networks, convolutional neural networks, CNN, recurent neural networks, RNN, long short term memory networks, LSTM
Academic year of topic announcement: 2016/2017
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Ing. Filip Jurčíček, Ph.D.
Author:
Guidelines
V poslední době, zejména díky využití výpočetních prostředků založených na GPU, se ukázalo, že neuronové sítě poskytují jedny z nejlepších výsledků v mnoha úlohách strojového učení. Cílem této práci je využití konvolučních a rekurentních neuronových sítí pro automatické rozpoznávání řeči. Pro tuto práci má moje skupinu k dispozici GPU karty NVIDIA Tesla K40 (cca. 2800 jader, 12 GB RAM) a NVIDIA GeForce Titan Z (cca. 5600 jader, 12 GB RAM). Hlavním cílem je vylepšení dialogového systému vyvíjeného v mé skupině popsaného na https://ufal.mff.cuni.cz/alex a dostupného na tel. čísle 800 899 998. Více o diplomových racích je na http://ufal.mff.cuni.cz/filip-jurcicek/theses-proposals.
References
Psutka, J. and Müller, L. and Matoušek, J. and Radová, V. : Mluvíme s počítačem česky. p. 752, Academia, Prague, 2006.
C. M. Bishop, Pattern Recognition and Machine Learning, vol. 4, no. 4. Springer, 2006, p. 738.
F. Jurcicek, B. Thomson, S. Young (2011) "Reinforcement learning for parameter estimation in statistical spoken dialogue systems". Computer Speech and Language
B. Thomson and S.Young (2010). "Bayesian update of dialogue state: A POMDP framework for spoken dialogue systems." Computer Speech and Language.
S. Young, M. Gasic, S. Keizer, F. Mairesse, J. Schatzmann, B. Thomson and K. Yu (2010). "The Hidden Information State Model: a practical framework for POMDP-based spoken dialogue management." Computer Speech and Language.
B. Thomson (2009). "Statistical methods for spoken dialogue management." Ph.D. Thesis. University of Cambridge.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html