|
|
|
||
Last update: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)
výslovnosti. Zvláštní pozornost bude věnována Skrytým Markovovým modelům použitým na řeč(FFT, n-dimenzionální klastrování, extrakci hodnot parametrů z dat, fonetické reprezentaci, prozodické analýze apod.). Příprava a trénování vlastních modelů rozpoznávání řeči. |
|
||
Last update: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)
Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, Cambridge, The HTK Book, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007
Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997
PFL038 Detaily a novinky |
|
||
Last update: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)
Úvod do produkce a vnímání řeči.
Základní principy automatického zpracování řeči (HMM)
rozpoznávání izolovaných slov,
definice výstupních pravděpodobností,
Baum-Welch trénovací algoritmus,
rozpoznávání a Viterbi algoritmus,
rozpoznávání plynulé řeči,
adaptace modelů na mluvčího.
Popis softwarového nářadí HTK
moduly pro přípravu dat,
moduly pro trénování, rozpoznávání a testování.
Příprava dat
gramatika úlohy,
jazykový model,
fonetický slovník,
nahrání dat, jejich přepis a kódování.
Vytvoření HMM monofonémů
vytvoření startovních modelů bez znalosti časových hranic fonémů,
ošetření modelu ticha,
automatické doladění přepisů.
Vytvoření HMM trifonémů
převod monofonému na trifonémy,
trifonémové sdílení stavů pomocí rozhodovacích stromů,
zjemnění pravděpodobnostních funkcí.
Metody vyhodnocení úspešnosti rozpoznávače.
Základní principy automatického generování řeči
Analýza prosodie mluvené řeči. |