Použití neuronových sítí pro automatické rozpoznávání řeči
Název práce v češtině: | Použití neuronových sítí pro automatické rozpoznávání řeči |
---|---|
Název v anglickém jazyce: | Neural networks for automatic speech recognition |
Klíčová slova: | automatické rozpoznávání řeči, ASR, neuronové sítě, convoluční neuronové sítě, CNN, rekurentní neuronové sítě, RNN, LSTM |
Klíčová slova anglicky: | automatic speech recognition, ASR, neural networks, convolutional neural networks, CNN, recurent neural networks, RNN, long short term memory networks, LSTM |
Akademický rok vypsání: | 2016/2017 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Ing. Filip Jurčíček, Ph.D. |
Řešitel: |
Zásady pro vypracování |
V poslední době, zejména díky využití výpočetních prostředků založených na GPU, se ukázalo, že neuronové sítě poskytují jedny z nejlepších výsledků v mnoha úlohách strojového učení. Cílem této práci je využití konvolučních a rekurentních neuronových sítí pro automatické rozpoznávání řeči. Pro tuto práci má moje skupinu k dispozici GPU karty NVIDIA Tesla K40 (cca. 2800 jader, 12 GB RAM) a NVIDIA GeForce Titan Z (cca. 5600 jader, 12 GB RAM). Hlavním cílem je vylepšení dialogového systému vyvíjeného v mé skupině popsaného na https://ufal.mff.cuni.cz/alex a dostupného na tel. čísle 800 899 998. Více o diplomových racích je na http://ufal.mff.cuni.cz/filip-jurcicek/theses-proposals. |
Seznam odborné literatury |
Psutka, J. and Müller, L. and Matoušek, J. and Radová, V. : Mluvíme s počítačem česky. p. 752, Academia, Prague, 2006.
C. M. Bishop, Pattern Recognition and Machine Learning, vol. 4, no. 4. Springer, 2006, p. 738. F. Jurcicek, B. Thomson, S. Young (2011) "Reinforcement learning for parameter estimation in statistical spoken dialogue systems". Computer Speech and Language B. Thomson and S.Young (2010). "Bayesian update of dialogue state: A POMDP framework for spoken dialogue systems." Computer Speech and Language. S. Young, M. Gasic, S. Keizer, F. Mairesse, J. Schatzmann, B. Thomson and K. Yu (2010). "The Hidden Information State Model: a practical framework for POMDP-based spoken dialogue management." Computer Speech and Language. B. Thomson (2009). "Statistical methods for spoken dialogue management." Ph.D. Thesis. University of Cambridge. |