Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Klasifikace založená na směsových modelech

Thesis title in Czech:	Klasifikace založená na směsových modelech
Thesis title in English:	Classification based on mixture models
Key words:	konečná směs\|normální směs\|klasifikace\|EM algoritmus\|věrohodnost
English key words:	finite mixture\|normal mixture\|classification\|EM algorithm\|likelihood
Academic year of topic announcement:	2021/2022
Thesis type:	Bachelor's thesis
Thesis language:	čeština
Department:	Department of Probability and Mathematical Statistics (32-KPMS)
Supervisor:	doc. RNDr. Arnošt Komárek, Ph.D.
Author:	Bc. Lucie Janečková - assigned and confirmed by the Study Dept.
Date of registration:	17.10.2021
Date of assignment:	19.10.2021
Confirmed by Study dept. on:	17.07.2023
Date and time of defence:	07.09.2023 09:00
Date of electronic submission:	20.07.2023
Date of submission of printed version:	24.07.2023
Date of proceeded defence:	07.09.2023
Opponents:	doc. RNDr. Matúš Maciak, Ph.D.

Guidelines

Autor(ka) zavede model konečné směsi s důrazem na model směsi vícerozměrných normálních rozdělení. Dále budou diskutovány způsoby výpočtu maximálně věrohodných odhadů a využití modelu ke klasifikaci ,,bez učitele`` (segmentaci). Součástí práce bude analýza reálných dat nebo simulační studie.

Práce bude psána v češtině nebo slovenštině pomocí systému LaTeX.

Úspěšné absolvování předmětu NMSA202: Pravděpodobnost a matematická statistika do okamžiku zápisu bakalářské práce nutné. Zápis této bakalářské práce předpokládá následné absolvování předmětu NMSA349: Bakalářské konzultace: Stochastika.

References

[1] Aitkin, M. (2001). Likelihood and Bayesian analysis of mixtures. Statistical Modelling, 1(4), 287-304, doi 10.1177/1471082X0100100404.
[2] Fraley, C. and Raftery, A. E. (2002). Model-based clustering, discriminant analysis, and density estimation. Journal of the American Statistical Association, 97(458), 611-631, doi 10.1198/016214502760047131.
[3] Fraley, C. and Raftery, A. E. (2003). Enhanced model-based clustering, density estimation, and discriminant analysis software: MCLUST. Journal of Classification, 20, 263-286, doi: 10.1007/s00357-003-0015-3.
[4] McLachlan, G. J. and and Basford, K. E. (1988). Mixture Models: Inference and Applications to Clustering. New York: Marcel Dekker, Inc. ISBN 0-8247-7691-7.
[5] McLachlan, G. J. and Peel, D. (2000). Finite Mixture Models. New York: John Wiley and Sons. ISBN 0-471-00626-2.

Preliminary scope of work

Uvažme situaci, kdy u každého z n jedinců z jisté populace zjišťujeme hodnoty několika znaků, jež následně reprezentujeme jako pozorované hodnoty n nezávislých stejně rozdělených náhodných vektorů. Model konečné směsi (pro rozdělení těchto náhodných vektorů) se hodí v situaci, kdy lze předpokládat, že se zkoumaná populace skládá z několika skupin s tím, že v každé skupině se sledované znaky chovají jinak (mají jiné rozdělení). Pokud navíc nevíme, který jedinec patří do té či oné skupiny, cílem statistické analýzy může být zjistit, kdo kam patří. Jedním ze způsobů jak to zjistit je potom klasifikace ,,bez učitele`` založená na směsových modelech, tzv. *model-based clustering*.