This course deals with speech recognition and generation tasks and feature extraction of voice and utterance
characteristics. Of particular interest will be topics related to Hidden Markov Models as applied to speech (FFT, n-
dimensional clustering, Gaussian mixtures, parameter value extraction from data, phonetic representation, prosodic
analysis etc.) and to their DNN-HMM hybrid models. Preparation and training of own speech recognition and
generation models.
Last update: Mírovský Jiří, RNDr., Ph.D. (11.05.2022)
Tato přednáška se zabývá rozpoznáváním řeči, generováním řeči, extrakcí hlasových rysů a modelováním charakteristik
výslovnosti. Zvláštní pozornost je věnována Skrytým Markovovým modelům použitým na řeč (FFT, n-dimenzionální
klastrování, extrakci hodnot parametrů z dat, fonetické reprezentaci, prozodické analýze apod.) a jejich DNN-HMM
hybridním modelům. Součástí cvičení je natrénování vlastních modelů rozpoznávání a generování řeči.
Last update: Mírovský Jiří, RNDr., Ph.D. (11.05.2022)
Course completion requirements -
Oral examination and project presentation.
The practical part is controlled through the preparation and presentation of own models for speech recognition and generation.
The presentation is repeatable.
Last update: Peterek Nino, Mgr., Ph.D. (10.06.2019)
Absolvování ústní zkoušky a zápočet.
Udělení zápočtu je vázáno na přípravu a předvedení vlastních modelů rozpoznávání a generování mluvené řeči.
Zápočet lze opakovat.
Last update: Peterek Nino, Mgr., Ph.D. (10.06.2019)
Literature -
Gernot A. Fink, Markov Models for Pattern Recognition, Springer, 2014
Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, The HTK Book, Cambridge, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007
Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997
Dong Yu,Li Deng, Automatic Speech Recognition A Deep Learning Approach, 2015
Last update: Peterek Nino, Mgr., Ph.D. (11.05.2022)
Gernot A. Fink, Markov Models for Pattern Recognition, Springer, 2014
Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, Cambridge, The HTK Book, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007
Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997
Dong Yu,Li Deng, Automatic Speech Recognition A Deep Learning Approach, 2015