Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Výpočet a aplikace MCD estimátoru pro robustní statistické analýzy
Název práce v češtině: Výpočet a aplikace MCD estimátoru pro robustní statistické analýzy
Název v anglickém jazyce: Computation and applications of the MCD estimator for robust statistical analysis
Klíčová slova: robustni statistika, minimum covariance determinant, fastMCD, C-step
Klíčová slova anglicky: robust statistics, minimum covariance determinant, fastMCD, C-step
Akademický rok vypsání: 2015/2016
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Katedra numerické matematiky (32-KNM)
Vedoucí / školitel: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 18.10.2015
Datum zadání: 20.10.2015
Datum potvrzení stud. oddělením: 07.12.2015
Datum a čas obhajoby: 05.09.2016 00:00
Datum odevzdání elektronické podoby:28.07.2016
Datum odevzdání tištěné podoby:28.07.2016
Datum proběhlé obhajoby: 05.09.2016
Oponenti: doc. RNDr. Iveta Hnětynková, Ph.D.
 
 
 
Konzultanti: RNDr. Jan Kalina, Ph.D.
Zásady pro vypracování
Čtení matematické a statistické literatury v angličtině, programování v Matlabu.
Seznam odborné literatury
- L. Eldén: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms 4, SIAM , 2007.

- M. Hubert and M. Debruyne: Minimum covariance determinant, WIREs Comp Stat, vol. 2, pp. 36–43, 2010.

- P. Rousseeuw and K. Van Driessen: A fast algorithm for the minimum covariance determinant estimator. Technometrics vol. 41, pp. 212–223, 1999.

- E. Roelant, S. Van Aelst and G. Willems: The minimum weighted covariance determinant estimator, Metrika, vol. 70, pp. 177–204, 2009.

- J. Kalina, J. Duintjer Tebbens and A. Schlenker: Robustness of high-dimensional data mining, Proceedings of ITAT 2014, Part II, V. Kurkova et al. (Eds.), Insitute of Computer Science AS CR, Prague, pp. 53-60, 2014.
Předběžná náplň práce
Očekávaná hodnota a směrodatná odchylka jsou základními veličinami mnoho typu statistických analýz. V případě, ze daná data obsahují outliers (odlehlivé hodnoty) je těžko tyto outliers odhalit a spočíst spolehlivé (róbustní) odhady očekávané hodnoty a směrodatné odchylky. Populární metodou pro určení spolehlivých odhadů je použití estimatoru MCD (minimum covariance determinant); jeho výpočet je však poměrně drahý. Cílem této práce je popis tohoto estimatoru především z pohledu numeriky (tj. výpočetních nákladů, stability atd.) a popis jeho silných a slabých stránek v typických aplikacích, kde róbustní odhady jsou zásadní (např. lékárenství, analýza obrazu, chemie).
 
Univerzita Karlova | Informační systém UK