Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Evolutionary Algorithms for Data Transformation
Thesis title in Czech: Transformace dat pomocí evolučních algoritmů
Thesis title in English: Evolutionary Algorithms for Data Transformation
Key words: vzdálenostní metriky, Mahalanobisova vzdálenost, redukce dimenze, evoluční algoritmy, vizualizace, transformace dat, neuronové sítě
English key words: distance metric learning, Mahalanobis distance, dimensionality reduction, evolutionary algorithms, visualisation, data transformation, neural networks
Academic year of topic announcement: 2016/2017
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor: Mgr. Martin Pilát, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 15.12.2016
Date of assignment: 15.12.2016
Confirmed by Study dept. on: 30.12.2016
Date and time of defence: 07.06.2017 10:00
Date of electronic submission:15.05.2017
Date of submission of printed version:12.05.2017
Date of proceeded defence: 07.06.2017
Opponents: Mgr. Roman Neruda, CSc.
 
 
 
Guidelines
Transformace dat jsou důležitou součástí strojového učení, která výrazně ovlivňuje kvalitu vytvořených modelů. Transformace dat se často používají i pro jejich zobrazení do prostoru s menší dimenzí, kde se dají snáze vizualizovat. Většina metod ale funguje bez učitele a tedy není schopna najít taková zobrazení dat, která by brala v úvahu vlastnosti metod strojového učení, které následují po ní, případně se snažila vizualizaci upravit tak, aby data ze stejné třídy byla blízko u sebe. Některé metody určené přímo pro vizualizaci (jako např. t-SNE) navíc ani neposkytují transformační funkci a nejsou tedy schopny zobrazit nová data bez přepočítání celého zobrazení. Cílem práce je tedy pomocí kombinace evolučních algoritmů a dalších přístupů (např. neuronových sítí) navrhnout metody pro vytvoření transformační funkce, která bude brát v úvahu i označkování dat.

Student se seznámí s postupy pro automatické transformace dat. Na základě zjištěných informací implementuje vlastní metody a porovná je s existujícími přístupy. Součástí srovnání bude i vhodnost použité metody pro zobrazení dat do prostoru s malou dimenzí vhodnou pro vizualizaci.
References
[1] Fukui, K.I., Ono, S., Megano, T. and Numao, M., 2013, November. Evolutionary distance metric learning approach to semi-supervised clustering with neighbor relations. In 2013 IEEE 25th International Conference on Tools with Artificial Intelligence (pp. 398-403). IEEE.

[2] Goldberger, J., Hinton, G.E., Roweis, S.T. and Salakhutdinov, R., 2004. Neighbourhood components analysis. In Advances in neural information processing systems (pp. 513-520).

[3] Maaten, L.V.D. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov), pp.2579-2605.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html