PředmětyPředměty(verze: 964)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Řečové technologie II - APH510085
Anglický název: Speech Technology II
Zajišťuje: Fonetický ústav (21-FU)
Fakulta: Filozofická fakulta
Platnost: od 2022
Semestr: letní
Body: 0
E-Kredity: 5
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:1/1, Z [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: AFO530003
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Ing. Tomáš Bořil, Ph.D.
Anotace -
Teoretický blok předmětu poskytuje ucelený přehled současného využití řečových technologií. Pomáhá studentům
v orientaci jak v principech fungování, tak v zásadách užití metodologických postupů řečových syntetizérů,
klasifikátorů a rozpoznávačů.

Výuka v LS 2021 bude probíhat v čase rozvrhu v příslušné skupině na MS Teams. Odkaz na skupinu bude studentům zaslán na začátku semestru před první hodinou. Při pozdějším zápisu se prosím obraťte e-mailem na vyučujícího.
Poslední úprava: Bořil Tomáš, Ing., Ph.D. (02.02.2021)
Podmínky zakončení předmětu

70% docházka, aktivní účast, vypracování seminární práce

Poslední úprava: Šturm Pavel, Mgr., Ph.D. (03.04.2020)
Literatura

Základní studijní literatura:

Uhlíř, J., Sovka, P., Pollák, P., Hanžl, V., Čmejla, R. (2007):

Technologie hlasových komunikací.

Psutka, J., Müller, L., Matoušek, J. & Radová, V. (2006): Mluvíme s počítačem česky. Praha: Academia. (vybrané části) Sovka, P. & Pollák, P. (2001). Vybrané metody číslicového zpracování signálů. Praha: Vydavatelství ČVUT.

Další odborná literatura:

Rabiner, L. & Juang, B.-H. (1993). Fundamentals of speech recognition.

Upper Saddle River, NJ: Prentice-Hall.

Rabiner, L. & Schafer, R. (1978). Digital Processing of Speech Signals. Englewood Cliffs: Prentice Hall.

Poslední úprava: Šturm Pavel, Mgr., Ph.D. (03.04.2020)
Sylabus -

Hlavní tematické okruhy:

1. Rozpoznávání řeči pomocí GMM a HMM

2. Klasifikátory - způsob trénování a testování, přehled algoritmů

3. Validace

4. Klasifikace pomocí Caret package v R

5. Binární rozhodování

6. Předzpracování dat

7. Klasifikační algoritmy Random forest, SVM

8. Neuronové sítě

9. Forenzní aplikace (rozpoznávání identity mluvčího, pohlaví, geografického původu, věku, emocionálního stavu atd.)

Poslední úprava: Šturm Pavel, Mgr., Ph.D. (03.04.2020)
Vstupní požadavky

Předmět navazuje na kurz Řečové technologie I a u studentů nefonetického bakalářského studia předpokládá znalosti akustiky řeči v rozsahu poskytovaném např. kurzem Akustika řeči.

Poslední úprava: Šturm Pavel, Mgr., Ph.D. (03.04.2020)
 
Univerzita Karlova | Informační systém UK