Creating Adversarial Examples in Machine Learning
Thesis title in Czech: | Vytváření matoucích vzorů ve strojovém učení |
---|---|
Thesis title in English: | Creating Adversarial Examples in Machine Learning |
Key words: | Nepřátelské vzory|Hluboké učení|Klasifikace obrazu|Evoluční algoritmy |
English key words: | Adversarial examples|{Deep Learning}|{Image classification}|{Evolutionary Algorithms |
Academic year of topic announcement: | 2023/2024 |
Thesis type: | rigorosum thesis |
Thesis language: | angličtina |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | Mgr. Martin Pilát, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 06.09.2023 |
Date of assignment: | 06.09.2023 |
Confirmed by Study dept. on: | 06.09.2023 |
Date and time of defence: | 08.11.2023 00:00 |
Date of electronic submission: | 07.09.2023 |
Date of submission of printed version: | 07.09.2023 |
Date of proceeded defence: | 08.11.2023 |
Guidelines |
Strojové učení dosáhlo v posledních letech mnoha významných úspěchů. Ukazuje se ale, že většina modelů je citlivá na tzv. matoucí vzory - to jsou např. vzory upravené tak, že člověk není schopen tuto úpravu rozpoznat, ale modely strojového učení klasifikují takto upravený vzor špatně. Dalším typem matoucího vzoru může být vstup, který člověk rozpozná pouze jako šum, ale model strojového učení jej s vysokou konfidencí klasifikuje jako jednu z cílových kategorií. V poslední době je téma obrany proti matoucím vzorům a hledání matoucích vzorů velmi intenzivně studováno. Cílem této práce je právě hledání matoucích vzorů, které budou schopné porážet moderní metody obrany.
Studentka nastuduje dostupnou literaturu týkající se vytváření matoucích vzorů a obrany proti nim. Na základě získaných znalostí potom navrhne postupy, které budou schopné vytvářet matoucí vzory schopné porazit moderní metody obrany. |
References |
[1] Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning. MIT Press, 2016. ISBN: 978-0-26-203561-3
[2] Ian J. Goodfellow, Jonathon Shlens, Christian Szegedy. Explaining and Harnessing Adversarial Examples. In: International Conference on Learning Representations 2015 (ICLR 2015). arXiv:1412.6572 [3] Alexey Kurakin, Ian J. Goodfellow, Samy Bengio. Adversial Machine Learning at Scale. In: International Conference on Learning Representations 2017 (ICLR 2017). arXiv:1611.01236v2 [4] Szegedy, Christian, Zaremba, Wojciech, Sutskever, Ilya, Bruna, Joan, Erhan, Dumitru, Goodfellow, Ian J.,and Fergus, Rob. Intriguing properties of neural networks. In: International Conference on Learning Representations 2014 (ICLR 2014), abs/1312.6199, 2014 [5] Tao Yu, Shengyuan Hu, Chuan Guo, Wei-Lun Chao, Kilian Q. Weinberger. A New Defense Against Adversarial Images: Turning a Weakness into a Strength. In: NeurIPS 2019. arXiv:1910.07629v2 |