Analysing and Optimizing GPU Kernels with Machine Learning
Thesis title in Czech: | Analýza a optimalizace GPU kernelů pomocí strojového učení |
---|---|
Thesis title in English: | Analysing and Optimizing GPU Kernels with Machine Learning |
Key words: | strojové učení, neuronové sítě, GPU, kernel, optimalizace, analýza |
English key words: | machine learning, neural networks, GPU, kernel, optimization, analysis |
Academic year of topic announcement: | 2019/2020 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | doc. RNDr. Martin Kruliš, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 18.10.2019 |
Date of assignment: | 25.10.2019 |
Confirmed by Study dept. on: | 19.11.2019 |
Date and time of defence: | 01.07.2020 09:00 |
Date of electronic submission: | 13.05.2020 |
Date of submission of printed version: | 28.05.2020 |
Date of proceeded defence: | 01.07.2020 |
Opponents: | RNDr. Milan Straka, Ph.D. |
Guidelines |
V současné době proniká strojové učení do většiny oblastí informatiky a v řadě z nich (např. v analýze obrazu) zaznamenává značné úspěchy. Jednou z oblastí, do které zatím zasáhlo strojové učení poměrně málo, je výkonnostní optimalizace kódu. Jedním z důvodů je fakt, že tato disciplína je velmi obtížná i pro člověka -- programátora.
V této práci se zaměříme na oblast paralelních výpočtů na GPU a jejich (semi)automatické optimalizace jak z hlediska návrhu kódu, tak z hlediska vhodné reprezentace dat v paměti nebo spouštěcích parametrů paralelních algoritmů. Prvním úkolem bude provést důkladnou rešerši současného stavu poznání, zejména pak stavu aktuálních vědeckých prototypů software. Cílem bude navrhnout úpravu těchto existujících nástrojů, případně na základě získaných poznatků navrhnout zcela nový nástroj, pro automatickou analýzu GPU kernelů a to zejména za účelem nalezení optimálních konfiguračních a spouštěcích parametrů a predikci doby běhu na základě znalosti velikosti dat a parametrů hardware. |
References |
Desarkar, Maunendra Sankar, and Ramakrishna Upadrasta. "IR2Vec: A Flow Analysis based Scalable Infrastructure for Program Encodings." arXiv. org (2019).
Cummins, Chris, et al. "End-to-end deep learning of optimization heuristics." 2017 26th International Conference on Parallel Architectures and Compilation Techniques (PACT). IEEE, 2017. Ian Goodfellow, Yoshua Bengio, Aaron Courville: Deep Learning. http://www.deeplearningbook.org/ |