Bayesovský výběr proměnných
Název práce v češtině: | Bayesovský výběr proměnných |
---|---|
Název v anglickém jazyce: | Bayesian variable selection |
Klíčová slova: | Výběr proměnných, Metody s indikátory, Metody se srážením |
Klíčová slova anglicky: | Variable Selection, Indicator Model Selection, Adaptive Shrinkage |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | prof. RNDr. Arnošt Komárek, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 09.02.2016 |
Datum zadání: | 10.02.2016 |
Datum potvrzení stud. oddělením: | 02.03.2016 |
Datum a čas obhajoby: | 14.06.2017 00:00 |
Datum odevzdání elektronické podoby: | 09.05.2017 |
Datum odevzdání tištěné podoby: | 12.05.2017 |
Datum proběhlé obhajoby: | 14.06.2017 |
Oponenti: | doc. RNDr. Zdeněk Hlávka, Ph.D. |
Zásady pro vypracování |
Posluchač nastuduje a vlastními slovy popíše obecné principy bayesovského výběru proměnných v kontextu regresních modelů. Následně se práce více zaměří na vybrané konkrétní metody. Tyto budou matematicky rigorózním způsobem popsány s podrobným odvozením alespoň některých základních vlastností. Práce se dále, dle zájmu studenta, bude věnovat buď aplikaci na reálných datech nebo numerickým studiím s cílem prozkoumat některé, teoreticky obtížněji odvoditelné aspekty studovaných metod.
Zápis této DP vyžaduje úspěšné ukončení předmětu Lineární regrese (NMSA407). V rámci práce na DP nutno absolvovat tyto povinně volitelné předměty: Pokročilé regresní modely (NMST432); Metody Markov Chain Monte Carlo (NMTP539); Bayesovské metody (NMST431). |
Seznam odborné literatury |
[1] Fahrmeir, L., Kneib, T., Lang, S., and Marx, B. (2013). Regression: Models, Methods and Applications. Heidelberg: Springer-Verlag, ISBN: 978-3-642-34332-2, doi: 10.1007/978-3-642-34333-9.
[2] Miller, A. (2002). Subset Selection in Regression, Second Edition. Boca Raton: Chapman & Hall/CRC, ISBN: 1-58488-171-2. [3] Fahrmeir, L., Kneib, T., and Konrath, S. (2010). Bayesian regularization in structured additive regression: A unifying perspective on shrinkage, smoothing and predictor selection. Statistics and Computing, 20(2), 203–219, doi: 10.1007/s11222-009-9158-3. [4] George, E. I. and McCulloch, R. E. (1993). Variable selection via Gibbs sampling. Journal of the American Statistical Association, 88(423), 881–889, doi: 10.1080/01621459.1993.10476353. [5] George, E. I. and McCulloch, R. E. (1997). Approaches for Bayesian variable selection. Statistica Sinica, 7(2), 339–373. [6] Malsiner-Walli, G. and Wagner, H. (2011). Comparing spike and slab priors for Bayesian variable selection. Austrian Journal of Statistics, 40(4), 241–264. [7] O'Hara, R. B. and Sillanpää, M. J. (2009). A review of Bayesian variable selection methods: what, how and which. Bayesian Analysis, 4(1), 85–117, doi: 10.1214/09-BA403. [8] Park, T. and Casella, G. (2008). The Bayesian Lasso. Journal of the American Statistical Association, 103(482), 681–686, doi: 10.1198/016214508000000337. |
Předběžná náplň práce |
Výběrem proměnných v rámci statistické analýzy dat se typicky rozumí výběr regresorů z potenciálně velké množiny proměnných, které mají být zahrnuty v regresním modelu. Jedním ze základních postupů používaných v tomto kontextu a implementovaných ve většině statistických programových balíků je tzv. kroková regrese (stepwise regression). Tato však typicky nepřináší uspokojivé výsledky. Bayesovský výběr proměnných (Bayesian variable selection) je jedním ze sofistikovanějších (s mnohem uspokojivějšími výsledky) přístupů, který navíc přirozenou formou umožňuje zahrnout do rozhodnutí o tom, které proměnné vybrat, též externí (apriorní) informaci.
Viz http://msekce.karlin.mff.cuni.cz/~komarek/prace_dipl/dipl2015_2.html |