Semi-supervised Learning from Unfavorably Distributed Data
Thesis title in Czech: | Semi-supervised učení z nepříznivě distribuovaných dat |
---|---|
Thesis title in English: | Semi-supervised Learning from Unfavorably Distributed Data |
Key words: | Semi-supervised učení, Hluboké učení, Nevyvážená distribuce |
English key words: | Semi-supervised Learning, Deep Learning, Unbalanced distribution |
Academic year of topic announcement: | 2019/2020 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | Mgr. Martin Pilát, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 10.02.2020 |
Date of assignment: | 24.02.2020 |
Confirmed by Study dept. on: | 12.03.2020 |
Date and time of defence: | 08.07.2020 09:00 |
Date of electronic submission: | 28.05.2020 |
Date of submission of printed version: | 28.05.2020 |
Date of proceeded defence: | 08.07.2020 |
Opponents: | doc. RNDr. Iveta Mrázová, CSc. |
Guidelines |
Semi-supervised učení je technika strojového učení kombinující učení s učitelem a učení bez učitele. Jeho cílem je během učení modelu využít vyjma označkovaných dat, pro která známe požadované výstupy, i mnohdy snadněji dostupná neoznačkovaná data, pro která požadované výstupy neznáme. Tím se snaží řešit častý problém s nedostatkem trénovacích dat, případně zlepšit robustnost naučeného modelu i když máme trénovacích dat dostatek. I přes poměrně rozsáhlý výzkum v této oblasti trpí známé metody semi-supervised učení mnoha problémy, které dosud výrazně omezovaly jejich využitelnost v praxi. Jedna ze situací kdy tyto problémy nastávají je, když mají označkovaná trénovací data a neoznačkovaná trénovací data rozdílné charakteristiky. Cílem diplomové práce je navrhnout metodu zmírňující tyto problémy.
Student si prostuduje dostupnou literaturu o semi-supervised učení a na jejím základě navrhne nové metody nebo vylepšení stávajících metod semi-supervised učení tak, aby byly robustnější vzhledem k rozdílným distribucím označkovaných a neoznačkovaných dat. Navržené metody nebo vylepšení následně student porovná s existujícími metodami semi-supervised učení. |
References |
[1] Avital Oliver, Augustus Odena, Colin Raffel, Ekin D. Cubuk, Ian J. Goodfellow. "Realistic Evaluation of Deep Semi-Supervised Learning Algorithms". arXiv:1804.09170. 2018.
[2] Olivier Chapelle, Bernhard Scholkopf,and Alexander Zien. "Semi-Supervised Learning". MIT Press, 2006. ISBN: 978-0262033589 [3] Andreas Look, Stefan Riedelbauch: "Dealing with Limited Access to Data: Comparison of Deep Learning Approaches". In: 2019 International Joint Conference on Neural Networks (IJCNN 2019). IEEE 2019. DOI: 10.1109/IJCNN.2019.8852064 |