Nepřátelské vzory pro modely rozpoznávání řeči
Název práce v češtině: | Nepřátelské vzory pro modely rozpoznávání řeči |
---|---|
Název v anglickém jazyce: | Adversarial Examples for Speech Recognition Models |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | bakalářská práce |
Jazyk práce: | |
Ústav: | Katedra teoretické informatiky a matematické logiky (32-KTIML) |
Vedoucí / školitel: | Mgr. Martin Pilát, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 05.03.2024 |
Datum zadání: | 11.03.2024 |
Datum potvrzení stud. oddělením: | 11.03.2024 |
Oponenti: | Mgr. Roman Neruda, CSc. |
Zásady pro vypracování |
Modely hlubokého učení dosahují skvělých výsledků v mnoha oblastech včetně oblasti rozpoznávání mluvené řeči. Tyto modely jsou ale zároveň náchylné na tzv. nepřátelské vzory - mírně upravené vstupy, které modely rozpoznají nesprávně, ačkoliv čisté vstupy rozpoznají správně. Nepřátelské vzory se nejčastěji studují v oblasti klasifikace obrázků, objevují se ale i v jiných oblastech - například v rozpoznávání řeči. Právě vytvářením nepřátelských vzorů pro rozpoznávání řeči se bude zabývat tato práce.
Student nastuduje modely pro rozpoznávání řeči a metody pro vytváření nepřátelských vzorů pro tyto modely. Na základě získaných znalostí vybrané metody implementuje v jednotném prostředí, porovná je mezi sebou a pokusí se navrhnout metodu novou. |
Seznam odborné literatury |
[1] Carlini, Nicholas, and David Wagner. "Audio adversarial examples: Targeted attacks on speech-to-text." In 2018 IEEE security and privacy workshops (SPW), pp. 1-7. IEEE, 2018.
[2] Iter, Dan, Jade Huang, and Mike Jermann. "Generating adversarial examples for speech recognition." Stanford Technical Report (2017). [3] Papernot, Nicolas, Patrick McDaniel, Ian Goodfellow, Somesh Jha, Z. Berkay Celik, and Ananthram Swami. "Practical black-box attacks against machine learning." In Proceedings of the 2017 ACM on Asia conference on computer and communications security, pp. 506-519. 2017. [4] Amodei, Dario, Sundaram Ananthanarayanan, Rishita Anubhai, Jingliang Bai, Eric Battenberg, Carl Case, Jared Casper et al. "Deep speech 2: End-to-end speech recognition in english and mandarin." In International conference on machine learning, pp. 173-182. PMLR, 2016. |