Vysoce robustní klasifikační analýza
Název práce v češtině: | Vysoce robustní klasifikační analýza |
---|---|
Název v anglickém jazyce: | Highly robust classification analysis |
Klíčová slova: | robustní statistika|lineární diskrimnační analýza|varianční matice|MWCD odhad|analýza reálných dat. |
Klíčová slova anglicky: | robust statistics|linear discriminant analysis|covariance matrix|MWCD estimator|real data analysis. |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | RNDr. Jan Kalina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 12.09.2023 |
Datum zadání: | 13.09.2023 |
Datum potvrzení stud. oddělením: | 13.10.2023 |
Zásady pro vypracování |
Lineární diskriminační analýza (LDA) představuje populární klasifikační metodu, která je ovšem velmi citlivá vůči přítomnosti odlehlých hodnot v datech. Přestože dnes již existuje řada robustních odhadů střední hodnoty a varianční matice mnohorozměrných dat, doposud se v literatuře nevěnovala velká pozornost jejich využití v klasifikačních analýze. V práci bude popsán MWCD odhad, který je založen na minimalizaci determinantu vážené varianční matice. Jako novinka bude navržena robustní verze LDA založená na MWCD odhadu společně s přibližným algoritmem pro její výpočet. Chování nové klasifikační metody bude studováno na reálných či simulačních datech. Zejména student/ka využije novou metodu při řešení klasifikačních úloh při analýze dat z veřejně dostupného Insolvenčního rejstříku v ČR. |
Seznam odborné literatury |
[1] Todorov V., Pires A.M. (2007): Comparative performance of several robust linear discriminant analysis methods. REVSTAT Statistical Journal 5, 63-83.
[2] Kalina J., Hlinka J. (2016): Highly robust classification: A regularized approach for omics data. Proceedings of the 9th International Joint Conference on Biomedical Engineering Systems and Technologies BIOSTEC 2016, Volume 3-Bioinformatics, 17-26. Článek vyšel ve sborníku konference v Římě, na níž získal ocenění Best Paper Award. [3] Kalina J., Tichavský J. (2022): The minimum weighted covariance determinant estimator for high-dimensional data. Advances in Data Analysis and Classification 16, 977-999. [4] Roelant E., Van Aelst S., Willems G. (2009): The minimum weighted covariance determinant estimator. Metrika 70, 177-204. |