Přednáška provádí posluchače současnými postupy a nástroji počítačového zpracování mluvené řeči umožňujícími budovat systémy pro automatický přepis a rozpoznávání mluvené řeči, hlasové dialogové systémy či hlasovou identifikaci mluvčích. Budou popsány principy, příprava a dekódovací algoritmy akustických a jazykových modelů (HMM, n-gramové a strukturované jazykové modely, FSM, grafové modely, heuristické prohledávání). Přednáška volně navazuje na úvodní seminář PFL038 a vhodně se doplňuje s přednáškami PFL067, PFL068.
Poslední úprava: T_UFAL (04.05.2017)
The course presents recent methodologies and software toolkits for speech recognition. Students will learn how to develop systems of automatic speech recognition and transcription, computer dialogue systems and speaker identification. The course shows principles, preparation and decoding algorithms of statistical acoustic and language models (HMM, n-gram and structured language models, final state transducers, graphical models, Viterbi dynamic programming, heuristic hypothesis search strategies, stack decoder). This course can be preceded by PFL038 and combined with PFL067, PFL068.
Literatura -
Poslední úprava: T_UFAL (04.05.2017)
[JEL] F. Jelinek, Statistical Methods for Speech Recognition, MIT Press, 1998
[PSU] J. Psutka, L. Müller, J. Matoušek, V. Radová, Mluvíme s počítačem česky, Academia, 2006
[SPO] X. Huang, A. Acero, H. Hon, Spoken Language Processing, Prentice-Hall, 2001
Poslední úprava: Mgr. Nino Peterek, Ph.D. (10.06.2019)
Zkouška proběhne formou vypracování malých projektů (první dva na společné zadání, třetí jako naprogramování menší řečové aplikace s pomocí dostupných nástrojů nebo naprogramování rozšiřující funkce řečové knihovny).
Poslední úprava: Mgr. Nino Peterek, Ph.D. (10.06.2019)
For successful completion of course programming of three small projects necessary (speech library functions and a small speech application).
Sylabus -
Poslední úprava: Mgr. Nino Peterek, Ph.D. (11.06.2019)
Přehled řečových technologií
nesamozřejmosti hlasové komunikace,
hlavní aplikace oboru a jejich architektura,
použité teorie a modely,
programátorské nástroje a knihovny,
knihy a časopisy řečových technologií.
Modelování akustiky (SPO C8-C9 | JEL C2-C3 | PSU C5.3, částečně opakování z PFL038)
struktura a parametry skrytých Markovových modelů(HMM),