Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Vysoce robustní klasifikační analýza
Název práce v češtině: Vysoce robustní klasifikační analýza
Název v anglickém jazyce: Highly robust classification analysis
Klíčová slova: robustní statistika|lineární diskrimnační analýza|varianční matice|MWCD odhad|analýza reálných dat.
Klíčová slova anglicky: robust statistics|linear discriminant analysis|covariance matrix|MWCD estimator|real data analysis.
Akademický rok vypsání: 2023/2024
Typ práce: diplomová práce
Jazyk práce:
Ústav: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Vedoucí / školitel: RNDr. Jan Kalina, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 12.09.2023
Datum zadání: 13.09.2023
Datum potvrzení stud. oddělením: 13.10.2023
Zásady pro vypracování
Lineární diskriminační analýza (LDA) představuje populární klasifikační metodu, která je ovšem velmi citlivá vůči přítomnosti odlehlých hodnot v datech. Přestože dnes již existuje řada robustních odhadů střední hodnoty a varianční matice mnohorozměrných dat, doposud se v literatuře nevěnovala velká pozornost jejich využití v klasifikačních analýze. V práci bude popsán MWCD odhad, který je založen na minimalizaci determinantu vážené varianční matice. Jako novinka bude navržena robustní verze LDA založená na MWCD odhadu společně s přibližným algoritmem pro její výpočet. Chování nové klasifikační metody bude studováno na reálných či simulačních datech. Zejména student/ka využije novou metodu při řešení klasifikačních úloh při analýze dat z veřejně dostupného Insolvenčního rejstříku v ČR.
Seznam odborné literatury
[1] Todorov V., Pires A.M. (2007): Comparative performance of several robust linear discriminant analysis methods. REVSTAT Statistical Journal 5, 63-83.
[2] Kalina J., Hlinka J. (2016): Highly robust classification: A regularized approach for omics data. Proceedings of the 9th International Joint Conference on Biomedical Engineering Systems and Technologies BIOSTEC 2016, Volume 3-Bioinformatics, 17-26. Článek vyšel ve sborníku konference v Římě, na níž získal ocenění Best Paper Award.
[3] Kalina J., Tichavský J. (2022): The minimum weighted covariance determinant estimator for high-dimensional data. Advances in Data Analysis and Classification 16, 977-999.
[4] Roelant E., Van Aelst S., Willems G. (2009): The minimum weighted covariance determinant estimator. Metrika 70, 177-204.
 
Univerzita Karlova | Informační systém UK