Předměty

Poslední úprava: T_UFAL (15.05.2002)

Úvod do číslicového zpracování signálu se zaměřením na zpracování řeči, akustika řeči, metody analýzy řečového signálu v časové i kmitočtové oblasti, kódování řeči, syntéza řečového signálu v časové i kmitočtové oblasti.

Poslední úprava: T_UFAL (15.05.2002)

Introduction to the digital signal processing with the focus on speech processing, speech acoustics, speech analysis methods in time and frequency domains, speech coding, synthesis of the speech signal in time and frequency domains.

Poslední úprava: RNDr. Pavel Zakouřil, Ph.D. (05.08.2002)

Digital Processing of Speech Signals (Rabiner, Schafer, 78)

An Introduction to Text-to-Speech Synthesis (Dutoit, 96)

Číslicově zpracování signálů (Uhlíř, Sovka 95)

Transformace Z a některá její použití (Vích 83)

Poslední úprava: T_UFAL (15.05.2002)

diskrétní signály a soustavy, DFT, FFT, transformace Z, číslicově filtry

akustika řeči, spektrální a časově charakteristiky řeči

analýza řečových signálů v časově oblasti, spektrální analýza, detekce základního tónu řeči, analýza a syntéza základního tónu řeči, detekce formantových kmitočtů

Cvičení 1 - Analýza řeči

analýza řečových signálů ve kmitočtové oblasti, spektrální analýza, rychlá Fourierova transformace - FFT

kódování řeči, lineárně prediktivní kódování, analýza a syntéza řeči, pokročilé kompresní algoritmy kódování řeči (RELP, CELP), kódovací algoritmy použité v sítích GSM

Cvičení 2 - Kódování řeči

metody syntézy řečových signálů, parametrický model syntézy řeči, formantová syntéza, lineárně prediktivní syntéza, kepstralni syntéza, harmonické modelování řeči, syntéza řeči v časově oblasti

Cvičení 3 - Syntéza řeči

kepstralni analýza, metoda dynamického borceni časově osy (DTW), Viterbiho algoritmus, skryté markovovské modely (HMM)

verifikace a rozpoznávání mluvčího, forenzní identifikace mluvčího

metody automatického rozpoznávání řeči, rozpoznávání izolovaných slov, rozpoznávání plynulé řeči

Cvičení 4 - Rozpoznávání řeči

Poslední úprava: T_UFAL (15.05.2002)

discrete signals and systems, DFT, FFT, Z-transformation, digital filters

speech acoustic, speech characteristics in time and frequency domain

speech signal analysis in time domain, spectral analysis, pitch detection, pitch contour analysis and synthesis, formants detection

Practice 1 - Speech analysis

speech signal analysis in frequency domain, spectral analysis, Fast Fourier Transform (FFT)

speech coding, Linear Predictive Coding (LPC), speech analysis and synthesis, advanced speech coding algorithms (RELP, CELP), GSM speech coding algoritms

Practice 2 - Speech coding

speech signals synthesis methods, parametric model of speech synthesis, formant synthesis, linear predictive synthesis, cepstral synthesis, harmonic speech modelling, speech synthesis in time domain

Practice 3 - Speech synthesis

cepstral analysis, Dynamic Time Warping (DTW) method, Viterbi algorithm, Hidden Markov Models (HMM)

speaker verification and recognition, forensic speaker identification

automatic speech recognition methods, recognition of isolated words, continuous speech recognition

Practice 4 - Speech recognition

References:

Digital Processing of Speech Signals (Rabiner, Schafer, 78)

An Introduction to Text-to-Speech Synthesis (Dutoit, 96)

Digital signal processing (in Czech) (Uhlíř, Sovka 95)

Z-Transformation and its using (Vích 83)