velikost textu

Evolutionary optimization of machine learning workflows

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Evolutionary optimization of machine learning workflows
Název v češtině:
Optimalizace metod strojového učení na základě evolučních algoritmů
Typ:
Bakalářská práce
Autor:
Bc. Gabriela Suchopárová
Vedoucí:
Mgr. Roman Neruda, CSc.
Oponent:
Mgr. Martin Pilát, Ph.D.
Id práce:
208475
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Katedra teoretické informatiky a matematické logiky (32-KTIML)
Program studia:
Informatika (B1801)
Obor studia:
Obecná informatika (IOI)
Přidělovaný titul:
Bc.
Datum obhajoby:
27. 6. 2019
Výsledek obhajoby:
Výborně
Jazyk práce:
Angličtina
Klíčová slova:
Strojové učení, Evoluční algoritmy, Meta-učení, Workflows
Klíčová slova v angličtině:
Machine learning, Evolutionary computing, Meta-learning, Workflows
Abstrakt:
Práce se zabývá automatickým strojovým učením (AutoML), které má za cíl automati- zovat proces výběru vhodného modelu strojového učení pro daný problém. Vyvinuli jsme systém, který pro zadanou úlohu učení s učitelem reprezentovanou množinou dat najde vhodné schéma řešení (pipeline) — kombinaci metod strojového učení, ansámblů a metod předzpracování. Jako prohledávací algoritmus jsme navrhli speciální variantu develop- mentálního genetického programování, která umožňuje reprezentovat orientované acyk- lické grafy schémat řešení pomocí stromů. Systém je implementován v programovacím jazyce Python a využívá knihovnu scikit-learn. Úspěšnost našeho řešení byla ověřena na 72 datových množinách benchmarku OpenML-CC18, na kterém jsme dosáhli dobrých výsledků. 1
Abstract v angličtině:
This work deals with automated machine learning (AutoML), which is a field that aims to automatize the process of model selection for a given machine learning problem. We have developed a system that, for a given supervised learning task represented by a dataset, finds a suitable pipeline — combination of machine learning, ensembles and preprocessing methods. For the search we designed a special instance of the developmental genetic programming which enables us to encode directed acyclic graph pipelines into a tree representation. The system is implemented in the Python programming language and operates on top of the scikit-learn library. The performance of our solution was tested on 72 datasets of the OpenML-CC18 benchmark with very good results. 1
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Bc. Gabriela Suchopárová 1.39 MB
Stáhnout Příloha k práci Bc. Gabriela Suchopárová 50 kB
Stáhnout Abstrakt v českém jazyce Bc. Gabriela Suchopárová 42 kB
Stáhnout Abstrakt anglicky Bc. Gabriela Suchopárová 40 kB
Stáhnout Posudek vedoucího Mgr. Roman Neruda, CSc. 103 kB
Stáhnout Posudek oponenta Mgr. Martin Pilát, Ph.D. 129 kB
Stáhnout Záznam o průběhu obhajoby doc. RNDr. Petr Hnětynka, Ph.D. 152 kB