Tato přednáška se zabývá rozpoznáváním řeči, generováním řeči, extrakcí hlasových rysů a modelováním charakteristik
výslovnosti. Zvláštní pozornost je věnována Skrytým Markovovým modelům použitým na řeč (FFT, n-dimenzionální
klastrování, extrakci hodnot parametrů z dat, fonetické reprezentaci, prozodické analýze apod.) a jejich DNN-HMM
hybridním modelům. Součástí cvičení je natrénování vlastních modelů rozpoznávání a generování řeči.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (11.05.2022)
This course deals with speech recognition and generation tasks and feature extraction of voice and utterance
characteristics. Of particular interest will be topics related to Hidden Markov Models as applied to speech (FFT, n-
dimensional clustering, Gaussian mixtures, parameter value extraction from data, phonetic representation, prosodic
analysis etc.) and to their DNN-HMM hybrid models. Preparation and training of own speech recognition and
generation models.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (11.05.2022)
Podmínky zakončení předmětu -
Absolvování ústní zkoušky a zápočet.
Udělení zápočtu je vázáno na přípravu a předvedení vlastních modelů rozpoznávání a generování mluvené řeči.
Zápočet lze opakovat.
Poslední úprava: Peterek Nino, Mgr., Ph.D. (10.06.2019)
Oral examination and project presentation.
The practical part is controlled through the preparation and presentation of own models for speech recognition and generation.
The presentation is repeatable.
Poslední úprava: Peterek Nino, Mgr., Ph.D. (10.06.2019)
Literatura -
Gernot A. Fink, Markov Models for Pattern Recognition, Springer, 2014
Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, Cambridge, The HTK Book, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007
Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997
Dong Yu,Li Deng, Automatic Speech Recognition A Deep Learning Approach, 2015
Poslední úprava: Peterek Nino, Mgr., Ph.D. (11.05.2022)
Gernot A. Fink, Markov Models for Pattern Recognition, Springer, 2014
Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, The HTK Book, Cambridge, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007
Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997
Dong Yu,Li Deng, Automatic Speech Recognition A Deep Learning Approach, 2015