PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Základy rozpoznávání a generování mluvené řeči - ATKL00321
Anglický název: Fundamentals of Speech Recognition and Generation
Zajišťuje: Ústav českého národního korpusu (21-UCNK)
Fakulta: Filozofická fakulta
Platnost: od 2023
Semestr: zimní
Body: 2
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:2/1, KZ [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Další informace: https://is.cuni.cz/studium/predmety/index.php?do=predmet&kod=NPFL038
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Nino Peterek, Ph.D.
Rozvrh   Nástěnka   
Anotace
Poslední úprava: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)
Tato přednáška se zabývá rozpoznáváním a generováním řeči a extrakcí hlasových rysů a charakteristik
výslovnosti. Zvláštní pozornost bude věnována Skrytým Markovovým modelům použitým na
řeč(FFT, n-dimenzionální klastrování, extrakci hodnot parametrů z dat, fonetické reprezentaci,
prozodické analýze apod.). Příprava a trénování vlastních modelů rozpoznávání řeči.
Literatura
Poslední úprava: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)

Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, Cambridge, The HTK Book, Entropic Ltd. http://htk.eng.cam.ac.uk, 1995-2007

Zdena Palková, Fonetika a fonologie češtiny, Karolinum, Praha, 1997

PFL038 Detaily a novinky

Sylabus
Poslední úprava: RNDr. Hana Skoumalová, Ph.D. (05.10.2012)

Úvod do produkce a vnímání řeči.

Základní principy automatického zpracování řeči (HMM)

rozpoznávání izolovaných slov,

definice výstupních pravděpodobností,

Baum-Welch trénovací algoritmus,

rozpoznávání a Viterbi algoritmus,

rozpoznávání plynulé řeči,

adaptace modelů na mluvčího.

Popis softwarového nářadí HTK

moduly pro přípravu dat,

moduly pro trénování, rozpoznávání a testování.

Příprava dat

gramatika úlohy,

jazykový model,

fonetický slovník,

nahrání dat, jejich přepis a kódování.

Vytvoření HMM monofonémů

vytvoření startovních modelů bez znalosti časových hranic fonémů,

ošetření modelu ticha,

automatické doladění přepisů.

Vytvoření HMM trifonémů

převod monofonému na trifonémy,

trifonémové sdílení stavů pomocí rozhodovacích stromů,

zjemnění pravděpodobnostních funkcí.

Metody vyhodnocení úspešnosti rozpoznávače.

Základní principy automatického generování řeči

Analýza prosodie mluvené řeči.

 
Univerzita Karlova | Informační systém UK