PředmětyPředměty(verze: 806)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Řečové technologie I - APH200047
Anglický název: Speech Technology I
Zajišťuje: Fonetický ústav (21-FU)
Fakulta: Filozofická fakulta
Platnost: od 2015
Semestr: zimní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:1/1 Z [hodiny/týden]
Počet míst: neomezen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Ing. Tomáš Bořil, Ph.D.
Vyučující: Ing. Tomáš Bořil, Ph.D.
Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (20.12.2016)

Tento předmět z nabídky PVP je vhodný až od 2. ročníku studia.

Předmět uvádí do teoretických i praktických otázek řečových technologií. Hlavním těžištěm je přehlednou a <br>
srozumitelnou formou seznámit se širokou oblastí pojmů, se kterými se studenti v oblasti řečových technologií <br>
běžně setkávají. Měli by pak být schopni samostatně pracovat s literaturou a orientovat se v technických termínech. <br>
Hlavní témata jsou zaměřena na syntézu a rozpoznávání řeči. Předmět má studentům zprostředkovat poznatky <br>
dosažené v této oblasti aplikovaného výzkumu z fonetického, ale i technického hlediska.<br>
<br>
Ve zkouškovém období nenásledujícím bezprostředně po semestru, ve kterém byl předmět vyučován, bude <br>
vypsán pouze jeden zkušební termín.<br>
Literatura
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (02.09.2014)

Základní studijní literatura:

Psutka, J., Müller, L., Matoušek, J. & Radová, V. (2006): Mluvíme s počítačem česky. Praha: Academia.

(vybrané části)

Uhlíř, J., Sovka, P., Pollák, P., Hanžl, V., Čmejla, R. (2007): Technologie hlasových komunikací.

Další odborná literatura a zdroje:

Keller, E. (ed.) (1994). Fundamentals of speech synthesis and speech recognition: Basic concepts, state-of-the-art and future challenges. New York: John Wiley & Sons. (4.-8. kapitola)

Palková, Z. - Ptáček, M. (1997): Modelling prosody in TTS diphone synthesis in Czech. In Wodarz, H.-W. (ed.). Speech processing. Selected topics from the Czech-German workshop. Frankfurt am Main: Hector, s. 59-77.

Požadavky ke zkoušce
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (02.09.2014)

aktivní účast, závěrečný test

Sylabus -
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (02.09.2014)

Hlavní tematické okruhy:
1. Teoretická východiska technického zpracování řeči, parametry v časové oblasti.

2. Segmentace signálu, motivace frekvenčních transformací.

3. Fourierovy řady a transformace, frekvenční charakteristika, prosakování ve spektru.

4. Praktická aplikace z-transformace v řečových technologiích.

5. Základní řečové parametry, autokorelační funkce.

6. Kepstrální koeficienty, rozpoznávání pomocí borcení časové osy DTW.

7. Moderní postupy robustní parametrizace.

8. Klasifikátory a skryté Markovovy modely HMM, jazykové modelování.

9. Řečové korpusy.

10. Typy syntézy řeči a jejich vlastnosti

Význam řečových technologií pro fonetický výzkum.

 
Univerzita Karlova | Informační systém UK