Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Výběr modelu na základě penalizované věrohodnosti
Název práce v češtině: Výběr modelu na základě penalizované věrohodnosti
Název v anglickém jazyce: Variable selection based on penalized likelihood
Klíčová slova: penalizované nejmenší čtverce, LASSO, SCAD, ladící parametr
Klíčová slova anglicky: penalized least squares, LASSO, SCAD, tuning parameter
Akademický rok vypsání: 2015/2016
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Vedoucí / školitel: doc. Mgr. Michal Kulich, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.09.2015
Datum zadání: 07.09.2015
Datum potvrzení stud. oddělením: 02.03.2016
Datum a čas obhajoby: 09.06.2016 00:00
Datum odevzdání elektronické podoby:12.05.2016
Datum odevzdání tištěné podoby:13.05.2016
Datum proběhlé obhajoby: 09.06.2016
Oponenti: doc. RNDr. Matúš Maciak, Ph.D.
 
 
 
Zásady pro vypracování
Práce se bude zabývat problémem výběru prediktorů regresního modelu v situaci, kdy máme k dispozici velký počet potenciálně silně korelovaných veličin, které lze do modelu zařadit. V posledních 20 letech byla navržena řada metod založených na penalizaci věrohodnostní funkce (mj. LASSO, SCAD), které mají velice zajímavé teoretické i praktické vlastnosti.

Cílem práce je přehledně a pečlivě shrnout, vysvětlit a porovnat různé přístupy k problému. Po naplnění tohoto cíle se práce může více soustředit na určitý aspekt podle výběru studenta - hlubší pojednání o teoretických vlastnostech metod, na výpočetní problematiku nebo na analýzu chování metod v praktických aplikacích. Práce může být doplněna simulační studií a/nebo analýzou reálných dat.
Seznam odborné literatury
Fan, J. & Li, R. (2001) Variable selection via nonconcave penalized likelihood and its oracle properties. Journal of the American Statistical Association 96, 1348-1360.

Fan, J. & Lv, J (2010) A Selective Overview of Variable Selection in High Dimensional Feature Space. Statistica Sinica 20, 101-148.

Tibshirani, R. (1996) Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society, Series B 58, 267-288.

Wang, H., Li, R. & Tsai, C.-L. (2007) Tuning parameter selectors for the smoothly clipped absolute deviation method. Biometrika 94, 553-568.

Zhang, C.-H. (2010) Nearly unbiased variable selection under minimax concave penalty. The Annals of Statistics 38, 894-942.

Zou, H. (2006). The adaptive lasso and its oracle properties. Journal of the American Statistical Association 101, 1418-1429.

Zou, H. & Zhang, H. H. (2009). On the adaptive elastic-net with a diverging number of parameters. The Annals of Statistics 37, 1733-1751.
Předběžná náplň práce
Téma lze rozvinout různými směry podle zájmu a schopností studenta -
např. rigoróznější odvození teoretických výsledků známých z
literatury, jejich zobecnění a rozšíření na nové situace, porovnávání
metod pomocí simulačních studií, přehled softwaru, implementace metod,
které dosud v softwaru nejsou k dispozici, kreativní aplikace na
data apod.

Téma předpokládá absolvování předmětů NMST432 Pokročilé regresní
modely a NMST434 Moderní statistické metody.
 
Univerzita Karlova | Informační systém UK