Klasifikace založená na směsových modelech
Thesis title in Czech: | Klasifikace založená na směsových modelech |
---|---|
Thesis title in English: | Classification based on mixture models |
Key words: | konečná směs|normální směs|klasifikace|EM algoritmus|věrohodnost |
English key words: | finite mixture|normal mixture|classification|EM algorithm|likelihood |
Academic year of topic announcement: | 2021/2022 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Probability and Mathematical Statistics (32-KPMS) |
Supervisor: | doc. RNDr. Arnošt Komárek, Ph.D. |
Author: | Bc. Lucie Janečková - assigned and confirmed by the Study Dept. |
Date of registration: | 17.10.2021 |
Date of assignment: | 19.10.2021 |
Confirmed by Study dept. on: | 17.07.2023 |
Date and time of defence: | 07.09.2023 09:00 |
Date of electronic submission: | 20.07.2023 |
Date of submission of printed version: | 24.07.2023 |
Date of proceeded defence: | 07.09.2023 |
Opponents: | doc. RNDr. Matúš Maciak, Ph.D. |
Guidelines |
Autor(ka) zavede model konečné směsi s důrazem na model směsi vícerozměrných normálních rozdělení. Dále budou diskutovány způsoby výpočtu maximálně věrohodných odhadů a využití modelu ke klasifikaci ,,bez učitele`` (segmentaci). Součástí práce bude analýza reálných dat nebo simulační studie.
Práce bude psána v češtině nebo slovenštině pomocí systému LaTeX. Úspěšné absolvování předmětu NMSA202: Pravděpodobnost a matematická statistika do okamžiku zápisu bakalářské práce nutné. Zápis této bakalářské práce předpokládá následné absolvování předmětu NMSA349: Bakalářské konzultace: Stochastika. |
References |
[1] Aitkin, M. (2001). Likelihood and Bayesian analysis of mixtures. Statistical Modelling, 1(4), 287-304, doi 10.1177/1471082X0100100404.
[2] Fraley, C. and Raftery, A. E. (2002). Model-based clustering, discriminant analysis, and density estimation. Journal of the American Statistical Association, 97(458), 611-631, doi 10.1198/016214502760047131. [3] Fraley, C. and Raftery, A. E. (2003). Enhanced model-based clustering, density estimation, and discriminant analysis software: MCLUST. Journal of Classification, 20, 263-286, doi: 10.1007/s00357-003-0015-3. [4] McLachlan, G. J. and and Basford, K. E. (1988). Mixture Models: Inference and Applications to Clustering. New York: Marcel Dekker, Inc. ISBN 0-8247-7691-7. [5] McLachlan, G. J. and Peel, D. (2000). Finite Mixture Models. New York: John Wiley and Sons. ISBN 0-471-00626-2. |
Preliminary scope of work |
Uvažme situaci, kdy u každého z n jedinců z jisté populace zjišťujeme hodnoty několika znaků, jež následně reprezentujeme jako pozorované hodnoty n nezávislých stejně rozdělených náhodných vektorů. Model konečné směsi (pro rozdělení těchto náhodných vektorů) se hodí v situaci, kdy lze předpokládat, že se zkoumaná populace skládá z několika skupin s tím, že v každé skupině se sledované znaky chovají jinak (mají jiné rozdělení). Pokud navíc nevíme, který jedinec patří do té či oné skupiny, cílem statistické analýzy může být zjistit, kdo kam patří. Jedním ze způsobů jak to zjistit je potom klasifikace ,,bez učitele`` založená na směsových modelech, tzv. *model-based clustering*. |