Poslední úprava: T_UFAL (15.05.2002)
- diskrétní signály a soustavy, DFT, FFT, transformace Z, číslicově filtry
- akustika řeči, spektrální a časově charakteristiky řeči
- analýza řečových signálů v časově oblasti, spektrální analýza, detekce základního tónu řeči, analýza a syntéza základního tónu řeči, detekce formantových kmitočtů
Cvičení 1 - Analýza řeči
- analýza řečových signálů ve kmitočtové oblasti, spektrální analýza, rychlá Fourierova transformace - FFT
- kódování řeči, lineárně prediktivní kódování, analýza a syntéza řeči, pokročilé kompresní algoritmy kódování řeči (RELP, CELP), kódovací algoritmy použité v sítích GSM
Cvičení 2 - Kódování řeči
- metody syntézy řečových signálů, parametrický model syntézy řeči, formantová syntéza, lineárně prediktivní syntéza, kepstralni syntéza, harmonické modelování řeči, syntéza řeči v časově oblasti
Cvičení 3 - Syntéza řeči
- kepstralni analýza, metoda dynamického borceni časově osy (DTW), Viterbiho algoritmus, skryté markovovské modely (HMM)
- verifikace a rozpoznávání mluvčího, forenzní identifikace mluvčího
- metody automatického rozpoznávání řeči, rozpoznávání izolovaných slov, rozpoznávání plynulé řeči
Cvičení 4 - Rozpoznávání řeči
Poslední úprava: T_UFAL (15.05.2002)
- discrete signals and systems, DFT, FFT, Z-transformation, digital filters
- speech acoustic, speech characteristics in time and frequency domain
- speech signal analysis in time domain, spectral analysis, pitch detection, pitch contour analysis and synthesis, formants detection
Practice 1 - Speech analysis
- speech signal analysis in frequency domain, spectral analysis, Fast Fourier Transform (FFT)
- speech coding, Linear Predictive Coding (LPC), speech analysis and synthesis, advanced speech coding algorithms (RELP, CELP), GSM speech coding algoritms
Practice 2 - Speech coding
- speech signals synthesis methods, parametric model of speech synthesis, formant synthesis, linear predictive synthesis, cepstral synthesis, harmonic speech modelling, speech synthesis in time domain
Practice 3 - Speech synthesis
- cepstral analysis, Dynamic Time Warping (DTW) method, Viterbi algorithm, Hidden Markov Models (HMM)
- speaker verification and recognition, forensic speaker identification
- automatic speech recognition methods, recognition of isolated words, continuous speech recognition
Practice 4 - Speech recognition
References:
Digital Processing of Speech Signals (Rabiner, Schafer, 78)
An Introduction to Text-to-Speech Synthesis (Dutoit, 96)
Digital signal processing (in Czech) (Uhlíř, Sovka 95)
Z-Transformation and its using (Vích 83)
|