Výběr modelu na základě penalizované věrohodnosti
Název práce v češtině: | Výběr modelu na základě penalizované věrohodnosti |
---|---|
Název v anglickém jazyce: | Variable selection based on penalized likelihood |
Klíčová slova: | penalizované nejmenší čtverce, LASSO, SCAD, ladící parametr |
Klíčová slova anglicky: | penalized least squares, LASSO, SCAD, tuning parameter |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | doc. Mgr. Michal Kulich, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 07.09.2015 |
Datum zadání: | 07.09.2015 |
Datum potvrzení stud. oddělením: | 02.03.2016 |
Datum a čas obhajoby: | 09.06.2016 00:00 |
Datum odevzdání elektronické podoby: | 12.05.2016 |
Datum odevzdání tištěné podoby: | 13.05.2016 |
Datum proběhlé obhajoby: | 09.06.2016 |
Oponenti: | doc. RNDr. Matúš Maciak, Ph.D. |
Zásady pro vypracování |
Práce se bude zabývat problémem výběru prediktorů regresního modelu v situaci, kdy máme k dispozici velký počet potenciálně silně korelovaných veličin, které lze do modelu zařadit. V posledních 20 letech byla navržena řada metod založených na penalizaci věrohodnostní funkce (mj. LASSO, SCAD), které mají velice zajímavé teoretické i praktické vlastnosti.
Cílem práce je přehledně a pečlivě shrnout, vysvětlit a porovnat různé přístupy k problému. Po naplnění tohoto cíle se práce může více soustředit na určitý aspekt podle výběru studenta - hlubší pojednání o teoretických vlastnostech metod, na výpočetní problematiku nebo na analýzu chování metod v praktických aplikacích. Práce může být doplněna simulační studií a/nebo analýzou reálných dat. |
Seznam odborné literatury |
Fan, J. & Li, R. (2001) Variable selection via nonconcave penalized likelihood and its oracle properties. Journal of the American Statistical Association 96, 1348-1360.
Fan, J. & Lv, J (2010) A Selective Overview of Variable Selection in High Dimensional Feature Space. Statistica Sinica 20, 101-148. Tibshirani, R. (1996) Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society, Series B 58, 267-288. Wang, H., Li, R. & Tsai, C.-L. (2007) Tuning parameter selectors for the smoothly clipped absolute deviation method. Biometrika 94, 553-568. Zhang, C.-H. (2010) Nearly unbiased variable selection under minimax concave penalty. The Annals of Statistics 38, 894-942. Zou, H. (2006). The adaptive lasso and its oracle properties. Journal of the American Statistical Association 101, 1418-1429. Zou, H. & Zhang, H. H. (2009). On the adaptive elastic-net with a diverging number of parameters. The Annals of Statistics 37, 1733-1751. |
Předběžná náplň práce |
Téma lze rozvinout různými směry podle zájmu a schopností studenta -
např. rigoróznější odvození teoretických výsledků známých z literatury, jejich zobecnění a rozšíření na nové situace, porovnávání metod pomocí simulačních studií, přehled softwaru, implementace metod, které dosud v softwaru nejsou k dispozici, kreativní aplikace na data apod. Téma předpokládá absolvování předmětů NMST432 Pokročilé regresní modely a NMST434 Moderní statistické metody. |