Výpočet a aplikace MCD estimátoru pro robustní statistické analýzy
Název práce v češtině: | Výpočet a aplikace MCD estimátoru pro robustní statistické analýzy |
---|---|
Název v anglickém jazyce: | Computation and applications of the MCD estimator for robust statistical analysis |
Klíčová slova: | robustni statistika, minimum covariance determinant, fastMCD, C-step |
Klíčová slova anglicky: | robust statistics, minimum covariance determinant, fastMCD, C-step |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Katedra numerické matematiky (32-KNM) |
Vedoucí / školitel: | doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 18.10.2015 |
Datum zadání: | 20.10.2015 |
Datum potvrzení stud. oddělením: | 07.12.2015 |
Datum a čas obhajoby: | 05.09.2016 00:00 |
Datum odevzdání elektronické podoby: | 28.07.2016 |
Datum odevzdání tištěné podoby: | 28.07.2016 |
Datum proběhlé obhajoby: | 05.09.2016 |
Oponenti: | doc. RNDr. Iveta Hnětynková, Ph.D. |
Konzultanti: | RNDr. Jan Kalina, Ph.D. |
Zásady pro vypracování |
Čtení matematické a statistické literatury v angličtině, programování v Matlabu. |
Seznam odborné literatury |
- L. Eldén: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms 4, SIAM , 2007.
- M. Hubert and M. Debruyne: Minimum covariance determinant, WIREs Comp Stat, vol. 2, pp. 36–43, 2010. - P. Rousseeuw and K. Van Driessen: A fast algorithm for the minimum covariance determinant estimator. Technometrics vol. 41, pp. 212–223, 1999. - E. Roelant, S. Van Aelst and G. Willems: The minimum weighted covariance determinant estimator, Metrika, vol. 70, pp. 177–204, 2009. - J. Kalina, J. Duintjer Tebbens and A. Schlenker: Robustness of high-dimensional data mining, Proceedings of ITAT 2014, Part II, V. Kurkova et al. (Eds.), Insitute of Computer Science AS CR, Prague, pp. 53-60, 2014. |
Předběžná náplň práce |
Očekávaná hodnota a směrodatná odchylka jsou základními veličinami mnoho typu statistických analýz. V případě, ze daná data obsahují outliers (odlehlivé hodnoty) je těžko tyto outliers odhalit a spočíst spolehlivé (róbustní) odhady očekávané hodnoty a směrodatné odchylky. Populární metodou pro určení spolehlivých odhadů je použití estimatoru MCD (minimum covariance determinant); jeho výpočet je však poměrně drahý. Cílem této práce je popis tohoto estimatoru především z pohledu numeriky (tj. výpočetních nákladů, stability atd.) a popis jeho silných a slabých stránek v typických aplikacích, kde róbustní odhady jsou zásadní (např. lékárenství, analýza obrazu, chemie). |