The course presents recent methodologies and software toolkits for speech recognition. Students will learn how to develop systems of automatic speech recognition and transcription, computer dialogue systems and speaker identification. The course shows principles, preparation and decoding algorithms of statistical acoustic and language models (HMM, n-gram and structured language models, final state transducers, graphical models, Viterbi dynamic programming, heuristic hypothesis search strategies, stack decoder). This course can be preceded by PFL038 and combined with PFL067, PFL068.
Last update: T_UFAL (04.05.2017)
Přednáška provádí posluchače současnými postupy a nástroji počítačového zpracování mluvené řeči umožňujícími budovat systémy pro automatický přepis a rozpoznávání mluvené řeči, hlasové dialogové systémy či hlasovou identifikaci mluvčích. Budou popsány principy, příprava a dekódovací algoritmy akustických a jazykových modelů (HMM, n-gramové a strukturované jazykové modely, FSM, grafové modely, heuristické prohledávání). Přednáška volně navazuje na úvodní seminář PFL038 a vhodně se doplňuje s přednáškami PFL067, PFL068.
Literature -
Last update: T_UFAL (05.05.2017)
[JEL] F. Jelinek, Statistical Methods for Speech Recognition, MIT Press, 1998
[PSU] J. Psutka, L. Müller, J. Matoušek, V. Radová, Mluvíme s počítačem česky, Academia, 2006
[SPO] X. Huang, A. Acero, H. Hon, Spoken Language Processing, Prentice-Hall, 2001
Last update: Mgr. Nino Peterek, Ph.D. (10.06.2019)
For successful completion of course programming of three small projects necessary (speech library functions and a small speech application).
Last update: Mgr. Nino Peterek, Ph.D. (10.06.2019)
Zkouška proběhne formou vypracování malých projektů (první dva na společné zadání, třetí jako naprogramování menší řečové aplikace s pomocí dostupných nástrojů nebo naprogramování rozšiřující funkce řečové knihovny).
Syllabus -
Last update: Mgr. Nino Peterek, Ph.D. (11.06.2019)