Výběr modelu na základě penalizované věrohodnosti
Thesis title in Czech: | Výběr modelu na základě penalizované věrohodnosti |
---|---|
Thesis title in English: | Variable selection based on penalized likelihood |
Key words: | penalizované nejmenší čtverce, LASSO, SCAD, ladící parametr |
English key words: | penalized least squares, LASSO, SCAD, tuning parameter |
Academic year of topic announcement: | 2015/2016 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Probability and Mathematical Statistics (32-KPMS) |
Supervisor: | doc. Mgr. Michal Kulich, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 07.09.2015 |
Date of assignment: | 07.09.2015 |
Confirmed by Study dept. on: | 02.03.2016 |
Date and time of defence: | 09.06.2016 00:00 |
Date of electronic submission: | 12.05.2016 |
Date of submission of printed version: | 13.05.2016 |
Date of proceeded defence: | 09.06.2016 |
Opponents: | doc. RNDr. Matúš Maciak, Ph.D. |
Guidelines |
Práce se bude zabývat problémem výběru prediktorů regresního modelu v situaci, kdy máme k dispozici velký počet potenciálně silně korelovaných veličin, které lze do modelu zařadit. V posledních 20 letech byla navržena řada metod založených na penalizaci věrohodnostní funkce (mj. LASSO, SCAD), které mají velice zajímavé teoretické i praktické vlastnosti.
Cílem práce je přehledně a pečlivě shrnout, vysvětlit a porovnat různé přístupy k problému. Po naplnění tohoto cíle se práce může více soustředit na určitý aspekt podle výběru studenta - hlubší pojednání o teoretických vlastnostech metod, na výpočetní problematiku nebo na analýzu chování metod v praktických aplikacích. Práce může být doplněna simulační studií a/nebo analýzou reálných dat. |
References |
Fan, J. & Li, R. (2001) Variable selection via nonconcave penalized likelihood and its oracle properties. Journal of the American Statistical Association 96, 1348-1360.
Fan, J. & Lv, J (2010) A Selective Overview of Variable Selection in High Dimensional Feature Space. Statistica Sinica 20, 101-148. Tibshirani, R. (1996) Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society, Series B 58, 267-288. Wang, H., Li, R. & Tsai, C.-L. (2007) Tuning parameter selectors for the smoothly clipped absolute deviation method. Biometrika 94, 553-568. Zhang, C.-H. (2010) Nearly unbiased variable selection under minimax concave penalty. The Annals of Statistics 38, 894-942. Zou, H. (2006). The adaptive lasso and its oracle properties. Journal of the American Statistical Association 101, 1418-1429. Zou, H. & Zhang, H. H. (2009). On the adaptive elastic-net with a diverging number of parameters. The Annals of Statistics 37, 1733-1751. |
Preliminary scope of work |
Téma lze rozvinout různými směry podle zájmu a schopností studenta -
např. rigoróznější odvození teoretických výsledků známých z literatury, jejich zobecnění a rozšíření na nové situace, porovnávání metod pomocí simulačních studií, přehled softwaru, implementace metod, které dosud v softwaru nejsou k dispozici, kreativní aplikace na data apod. Téma předpokládá absolvování předmětů NMST432 Pokročilé regresní modely a NMST434 Moderní statistické metody. |