Evolutionary Algorithms for Data Transformation
Thesis title in Czech: | Transformace dat pomocí evolučních algoritmů |
---|---|
Thesis title in English: | Evolutionary Algorithms for Data Transformation |
Key words: | vzdálenostní metriky, Mahalanobisova vzdálenost, redukce dimenze, evoluční algoritmy, vizualizace, transformace dat, neuronové sítě |
English key words: | distance metric learning, Mahalanobis distance, dimensionality reduction, evolutionary algorithms, visualisation, data transformation, neural networks |
Academic year of topic announcement: | 2016/2017 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | Mgr. Martin Pilát, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 15.12.2016 |
Date of assignment: | 15.12.2016 |
Confirmed by Study dept. on: | 30.12.2016 |
Date and time of defence: | 07.06.2017 10:00 |
Date of electronic submission: | 15.05.2017 |
Date of submission of printed version: | 12.05.2017 |
Date of proceeded defence: | 07.06.2017 |
Opponents: | Mgr. Roman Neruda, CSc. |
Guidelines |
Transformace dat jsou důležitou součástí strojového učení, která výrazně ovlivňuje kvalitu vytvořených modelů. Transformace dat se často používají i pro jejich zobrazení do prostoru s menší dimenzí, kde se dají snáze vizualizovat. Většina metod ale funguje bez učitele a tedy není schopna najít taková zobrazení dat, která by brala v úvahu vlastnosti metod strojového učení, které následují po ní, případně se snažila vizualizaci upravit tak, aby data ze stejné třídy byla blízko u sebe. Některé metody určené přímo pro vizualizaci (jako např. t-SNE) navíc ani neposkytují transformační funkci a nejsou tedy schopny zobrazit nová data bez přepočítání celého zobrazení. Cílem práce je tedy pomocí kombinace evolučních algoritmů a dalších přístupů (např. neuronových sítí) navrhnout metody pro vytvoření transformační funkce, která bude brát v úvahu i označkování dat.
Student se seznámí s postupy pro automatické transformace dat. Na základě zjištěných informací implementuje vlastní metody a porovná je s existujícími přístupy. Součástí srovnání bude i vhodnost použité metody pro zobrazení dat do prostoru s malou dimenzí vhodnou pro vizualizaci. |
References |
[1] Fukui, K.I., Ono, S., Megano, T. and Numao, M., 2013, November. Evolutionary distance metric learning approach to semi-supervised clustering with neighbor relations. In 2013 IEEE 25th International Conference on Tools with Artificial Intelligence (pp. 398-403). IEEE.
[2] Goldberger, J., Hinton, G.E., Roweis, S.T. and Salakhutdinov, R., 2004. Neighbourhood components analysis. In Advances in neural information processing systems (pp. 513-520). [3] Maaten, L.V.D. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov), pp.2579-2605. |