Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Nepřátelské vzory pro modely rozpoznávání řeči

Název práce v češtině:	Nepřátelské vzory pro modely rozpoznávání řeči
Název v anglickém jazyce:	Adversarial Examples for Speech Recognition Models
Akademický rok vypsání:	2023/2024
Typ práce:	bakalářská práce
Jazyk práce:
Ústav:	Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel:	Mgr. Martin Pilát, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	05.03.2024
Datum zadání:	11.03.2024
Datum potvrzení stud. oddělením:	11.03.2024
Oponenti:	Mgr. Roman Neruda, CSc.

Zásady pro vypracování

Modely hlubokého učení dosahují skvělých výsledků v mnoha oblastech včetně oblasti rozpoznávání mluvené řeči. Tyto modely jsou ale zároveň náchylné na tzv. nepřátelské vzory - mírně upravené vstupy, které modely rozpoznají nesprávně, ačkoliv čisté vstupy rozpoznají správně. Nepřátelské vzory se nejčastěji studují v oblasti klasifikace obrázků, objevují se ale i v jiných oblastech - například v rozpoznávání řeči. Právě vytvářením nepřátelských vzorů pro rozpoznávání řeči se bude zabývat tato práce.

Student nastuduje modely pro rozpoznávání řeči a metody pro vytváření nepřátelských vzorů pro tyto modely. Na základě získaných znalostí vybrané metody implementuje v jednotném prostředí, porovná je mezi sebou a pokusí se navrhnout metodu novou.

Seznam odborné literatury

[1] Carlini, Nicholas, and David Wagner. "Audio adversarial examples: Targeted attacks on speech-to-text." In 2018 IEEE security and privacy workshops (SPW), pp. 1-7. IEEE, 2018.
[2] Iter, Dan, Jade Huang, and Mike Jermann. "Generating adversarial examples for speech recognition." Stanford Technical Report (2017).
[3] Papernot, Nicolas, Patrick McDaniel, Ian Goodfellow, Somesh Jha, Z. Berkay Celik, and Ananthram Swami. "Practical black-box attacks against machine learning." In Proceedings of the 2017 ACM on Asia conference on computer and communications security, pp. 506-519. 2017.
[4] Amodei, Dario, Sundaram Ananthanarayanan, Rishita Anubhai, Jingliang Bai, Eric Battenberg, Carl Case, Jared Casper et al. "Deep speech 2: End-to-end speech recognition in english and mandarin." In International conference on machine learning, pp. 173-182. PMLR, 2016.