PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Řečové technologie II - APH610027
Anglický název: Speech Technology II
Zajišťuje: Fonetický ústav (21-FU)
Fakulta: Filozofická fakulta
Platnost: od 2021
Semestr: letní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:1/1, Z [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: AFO530003
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Ing. Tomáš Bořil, Ph.D.
Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Ing. Tomáš Bořil, Ph.D. (02.02.2021)
Teoretický blok předmětu poskytuje ucelený přehled současného využití řečových technologií. Pomáhá studentům
v orientaci jak v principech fungování, tak v zásadách užití metodologických postupů řečových syntetizérů,
klasifikátorů a rozpoznávačů.

Výuka v LS 2021 bude probíhat v čase rozvrhu v příslušné skupině na MS Teams. Odkaz na skupinu bude studentům zaslán na začátku semestru před první hodinou. Při pozdějším zápisu se prosím obraťte e-mailem na vyučujícího.
Podmínky zakončení předmětu
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

70% docházka, aktivní účast, vypracování seminární práce

Literatura
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Základní studijní literatura:

Uhlíř, J., Sovka, P., Pollák, P., Hanžl, V., Čmejla, R. (2007):

Technologie hlasových komunikací.

Psutka, J., Müller, L., Matoušek, J. & Radová, V. (2006): Mluvíme s počítačem česky. Praha: Academia. (vybrané části) Sovka, P. & Pollák, P. (2001). Vybrané metody číslicového zpracování signálů. Praha: Vydavatelství ČVUT.

Další odborná literatura:

Rabiner, L. & Juang, B.-H. (1993). Fundamentals of speech recognition.

Upper Saddle River, NJ: Prentice-Hall.

Rabiner, L. & Schafer, R. (1978). Digital Processing of Speech Signals. Englewood Cliffs: Prentice Hall.

Sylabus -
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Hlavní tematické okruhy:

1. Rozpoznávání řeči pomocí GMM a HMM

2. Klasifikátory - způsob trénování a testování, přehled algoritmů

3. Validace

4. Klasifikace pomocí Caret package v R

5. Binární rozhodování

6. Předzpracování dat

7. Klasifikační algoritmy Random forest, SVM

8. Neuronové sítě

9. Forenzní aplikace (rozpoznávání identity mluvčího, pohlaví, geografického původu, věku, emocionálního stavu atd.)

Vstupní požadavky
Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Předmět navazuje na kurz Řečové technologie I a u studentů nefonetického bakalářského studia předpokládá znalosti akustiky řeči v rozsahu poskytovaném např. kurzem Akustika řeči.

 
Univerzita Karlova | Informační systém UK