Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Řečové technologie II - APH610027

Anglický název:	Speech Technology II
Zajišťuje:	Fonetický ústav (21-FU)
Fakulta:	Filozofická fakulta
Platnost:	od 2021
Semestr:	letní
Body:	0
E-Kredity:	3
Způsob provedení zkoušky:	letní s.:
Rozsah, examinace:	letní s.:1/1, Z [HT]
Počet míst:	neurčen / neurčen (neurčen)
Minimální obsazenost:	neomezen
4EU+:	ne
Virtuální mobilita / počet míst pro virtuální mobilitu:	ne
Kompetence:
Stav předmětu:	nevyučován
Jazyk výuky:	čeština
Způsob výuky:	prezenční
Způsob výuky:	prezenční
Úroveň:
Je zajišťováno předmětem:	AFO530003
Poznámka:	předmět je možno zapsat mimo plán povolen pro zápis po webu

Garant:	Ing. Tomáš Bořil, Ph.D.

Rozvrh Nástěnka

Anotace -

Poslední úprava: Ing. Tomáš Bořil, Ph.D. (02.02.2021)

Teoretický blok předmětu poskytuje ucelený přehled současného využití řečových technologií. Pomáhá studentům
v orientaci jak v principech fungování, tak v zásadách užití metodologických postupů řečových syntetizérů,
klasifikátorů a rozpoznávačů.

Výuka v LS 2021 bude probíhat v čase rozvrhu v příslušné skupině na MS Teams. Odkaz na skupinu bude studentům zaslán na začátku semestru před první hodinou. Při pozdějším zápisu se prosím obraťte e-mailem na vyučujícího.

Podmínky zakončení předmětu

Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

70% docházka, aktivní účast, vypracování seminární práce

Literatura

Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Základní studijní literatura:

Uhlíř, J., Sovka, P., Pollák, P., Hanžl, V., Čmejla, R. (2007):

Technologie hlasových komunikací.

Psutka, J., Müller, L., Matoušek, J. & Radová, V. (2006): Mluvíme s počítačem česky. Praha: Academia. (vybrané části) Sovka, P. & Pollák, P. (2001). Vybrané metody číslicového zpracování signálů. Praha: Vydavatelství ČVUT.

Další odborná literatura:

Rabiner, L. & Juang, B.-H. (1993). Fundamentals of speech recognition.

Upper Saddle River, NJ: Prentice-Hall.

Rabiner, L. & Schafer, R. (1978). Digital Processing of Speech Signals. Englewood Cliffs: Prentice Hall.

Sylabus -

Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Hlavní tematické okruhy:

1. Rozpoznávání řeči pomocí GMM a HMM

2. Klasifikátory - způsob trénování a testování, přehled algoritmů

3. Validace

4. Klasifikace pomocí Caret package v R

5. Binární rozhodování

6. Předzpracování dat

7. Klasifikační algoritmy Random forest, SVM

8. Neuronové sítě

9. Forenzní aplikace (rozpoznávání identity mluvčího, pohlaví, geografického původu, věku, emocionálního stavu atd.)

Vstupní požadavky

Poslední úprava: Mgr. Pavel Šturm, Ph.D. (03.04.2020)

Předmět navazuje na kurz Řečové technologie I a u studentů nefonetického bakalářského studia předpokládá znalosti akustiky řeči v rozsahu poskytovaném např. kurzem Akustika řeči.