velikost textu

Porovnání metod získávání znalostí z dat

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Porovnání metod získávání znalostí z dat
Název v angličtině:
Comparing methods of knowledge discovery from data
Typ:
Diplomová práce
Autor:
Mgr. Iva Jungmannová
Vedoucí:
prof. RNDr. Jiří Ivánek, CSc.
Oponent:
Jan Dvořák, Dr.
Id práce:
158938
Fakulta:
Filozofická fakulta (FF)
Pracoviště:
Ústav informačních studií a knihovnictví (21-UISK)
Program studia:
Informační studia a knihovnictví (N7201)
Obor studia:
Informační studia a knihovnictví (INSK)
Přidělovaný titul:
Mgr.
Datum obhajoby:
21. 1. 2019
Výsledek obhajoby:
Výborně
Jazyk práce:
Čeština
Klíčová slova:
dobývání znalostí z databází|data mining|strojové učení|statistika|datová analýza|získávání znalostí
Klíčová slova v angličtině:
knowledge mining from databases|data mining|machine learning|statistics|data analysis|knowledge acquisition
Abstrakt:
Abstrakt (česky) Diplomová práce se zabývá porovnáním některých metod dobývání znalostí z dat. Na vzorku dat se aplikovaly metody rozhodovacího stromu, klasifikačních pravidel, shlukové analýzy a naivního bayesovského klasifikátoru. Pracovalo se s daty o klientech neziskové organizace Asociace občanských poraden. Postupovalo se podle technologického procesu dobývání znalostí, proběhl popis dat, předzpracování dat, data mining (modelování) a otestování a interpretace výsledků. Vzhledem k aplikaci na shodný vzorek dat, s podobným předzpracováním dat, se dalo očekávat, že část výsledků by mohla být rovněž odpovídající. Zjišťoval se nejen překryv výsledků, ale i jejich rozdíly. Zjišťovalo se, jaké charakteristiky mají klienti podle jejich výše dluhu. Výsledky opravdu ukázaly některé vzory opakující se ve většině metod. Vyšlo najevo, že výše dluhu klienta souvisí s počtem věřitelů klienta. Čím větší počet věřitelů, tím spíše má klient vyšší dluhy. U klientů s větším dluhem se také objevovala vyšší celková výše závazků. Toto zřejmě nejsou nijak překvapivé závěry, avšak dokazují funkčnost modelů a porovnatelnost výsledků.
Abstract v angličtině:
Abstract (in English): The thesis is devoted to the comparison of a few methods of mining knowledge from data. Methods decision tree, classification rules, cluster analysis, and Naive Bayes classifier were applied to the data sample. Data about clients of a non-profit organization Association of Civil Counseling were used. It has been worked according to the technological process of knowledge mining. In the thesis was applied data description, data preparation, modeling and testing and results from interpretation. Because of using the same sample of data and similar data preparation, overlapping results are also expected. The research is focused not only on results similarity, but also differences in results. The correlation between the amount of debt of clients and other attributes was found. In the results, there really were some patterns repeating through most of all methods. It turned out the amount of debt is related to a number of creditors. The more creditors, the higher amount of debt. Clients with a higher amount of liabilities had also higher debt. The results might not be surprising, but it proves the functionality of models and comparability of results.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Mgr. Iva Jungmannová 2.78 MB
Stáhnout Abstrakt v českém jazyce Mgr. Iva Jungmannová 182 kB
Stáhnout Abstrakt anglicky Mgr. Iva Jungmannová 177 kB
Stáhnout Posudek vedoucího prof. RNDr. Jiří Ivánek, CSc. 285 kB
Stáhnout Posudek oponenta Jan Dvořák, Dr. 42 kB
Stáhnout Záznam o průběhu obhajoby prof. RNDr. Jiří Ivánek, CSc. 152 kB
Stáhnout Errata Mgr. Iva Jungmannová 204 kB