|
|
|
||
Poslední úprava: RNDr. Filip Zavoral, Ph.D. (17.03.2021)
|
|
||
Poslední úprava: RNDr. Filip Zavoral, Ph.D. (16.03.2021)
V rámci cvičení každý student dostane (nebo si sám vybere a nechá cvičícím schválit) vhodnou reálnou datovou sadu. Nad ní postupně vyzkouší jednotlivé fáze data science projektu probírané na přednáškách. Výsledky prostupného zpracování dat shrne ve formě dvou písemných reportů (v polovině a na konci semestru), které budou bodově ohodnoceny. Zápočet bude udělen za daný minimální počet bodů. Body získané navíc budou přičteny k bodům z písemného zkouškového testu. |
|
||
Poslední úprava: RNDr. Filip Zavoral, Ph.D. (16.03.2021)
Sinan Ozdemir: Principles of Data Science Tony Ojeda, Sean Patrick Murphy, Benjamin Bengfort, Abhijit Dasgupta: Practical Data Science Cookbook Frank Kane: Hands-On Data Science and Python Machine Learning |
|
||
Poslední úprava: RNDr. Filip Zavoral, Ph.D. (16.03.2021)
Co je to data science, typické příklady použití. Data science desetiboj (přehled souvisejících metod, algoritmů a technologií). Mapa navazujících přednášek, organizace předmětu, požadavky na zápočet/zkoušku. Motivace a problémy data science - pohled z praxe. Limity statistických metod, zkreslení. Technologie pro data science I: přehled populárních zástupců (technologický stack), Python a data science. Fáze data science projektu, metodika CRISP-DM. Business understanding, data understanding. Metody explorace a vizualizace dat. Tvorba srozumitelného reportu. Příprava dat (čištění, transformace, extrakce příznaků, ...). Modelování I: základní statistické modely a vyhodnocování výkonnosti. Modelování II: aplikovaný bayesianismus. Data science v moderních databázových systémech. Big Data science, MapReduce a data science. Apache Spark a data science. Technologie pro data science II: MLops verzování, dokumentace, ... Manažerský pohled na data science projekt. |