PředmětyPředměty(verze: 849)
Předmět, akademický rok 2019/2020
   Přihlásit přes CAS
Řečové technologie II - APH610027
Anglický název: Speech Technology II
Zajišťuje: Fonetický ústav (21-FU)
Fakulta: Filozofická fakulta
Platnost: od 2018
Semestr: letní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:1/1 Z [hodiny/týden]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Ing. Tomáš Bořil, Ph.D.
Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (04.05.2018)
Teoretický blok kurzu poskytuje ucelený přehled současného využití řečových technologií. Pomáhá studentům v
orientaci jak v principech fungování, tak v zásadách užití metodologických postupů řečových syntetizérů a
rozpoznávačů. Navazuje na kurz Řečové technologie I a u studentů nefonetického bakalářského studia
předpokládá znalosti akustiky řeči v rozsahu poskytovaném např. kurzem Akustika řeči I a II.

Ve zkouškovém období nenásledujícím bezprostředně po semestru, ve kterém byl předmět vyučován, bude
vypsán pouze jeden zkušební termín.
Literatura
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (04.05.2018)
Základní studijní literatura:
Uhlíř, J., Sovka, P., Pollák, P., Hanžl, V., Čmejla, R. (2007):

Technologie hlasových komunikací.

Psutka, J., Müller, L., Matoušek, J. & Radová, V. (2006): Mluvíme s počítačem česky. Praha: Academia. (vybrané části) Sovka, P. & Pollák, P. (2001). Vybrané metody číslicového zpracování signálů. Praha: Vydavatelství ČVUT.

Další odborná literatura:
Rabiner, L. & Juang, B.-H. (1993). Fundamentals of speech recognition.

Upper Saddle River, NJ: Prentice-Hall.

Rabiner, L. & Schafer, R. (1978). Digital Processing of Speech Signals. Englewood Cliffs: Prentice Hall.

Sylabus -
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (04.05.2018)
Hlavní tematické okruhy:
1. Rozpoznávání řeči pomocí GMM a HMM

2. Klasifikátory - způsob trénování a testování, přehled algoritmů

3. Validace

4. Klasifikace pomocí Caret package v R

5. Binární rozhodování

6. Předzpracování dat

7. Klasifikační algoritmy Random forest, SVM

8. Neuronové sítě

9. Forenzní aplikace (rozpoznávání identity mluvčího, pohlaví, geografického původu, věku, emocionálního stavu atd.)

Vstupní požadavky
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (05.03.2013)

Předmět navazuje na kurz Řečové technologie I a u studentů nefonetického bakalářského studia předpokládá znalosti akustiky řeči v rozsahu poskytovaném např. kurzem Akustika řeči.

 
Univerzita Karlova | Informační systém UK