Modely pro data s nadbytečnými nulami
Název práce v češtině: | Modely pro data s nadbytečnými nulami |
---|---|
Název v anglickém jazyce: | Models for zero-inflated data |
Klíčová slova: | modely s nadbytečnými nulami, poissonovské modely s nadbytečnými nulami, modely bez nulové složky, hradbové modely, EM algoritmus |
Klíčová slova anglicky: | zero inflated models, zero inflated Poisson models, zero truncated models, hurdle models, EM algorithm |
Akademický rok vypsání: | 2013/2014 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | doc. Mgr. Michal Kulich, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 20.02.2014 |
Datum zadání: | 20.02.2014 |
Datum potvrzení stud. oddělením: | 18.03.2014 |
Datum a čas obhajoby: | 05.09.2016 00:00 |
Datum odevzdání elektronické podoby: | 26.07.2016 |
Datum odevzdání tištěné podoby: | 28.07.2016 |
Datum proběhlé obhajoby: | 05.09.2016 |
Oponenti: | doc. RNDr. Daniel Hlubinka, Ph.D. |
Zásady pro vypracování |
Práce se bude zabývat tzv. "zero-inflation" modely. Jde o analýzu diskrétní veličiny, která s velkou pravděpodobností nabývá hodnoty 0, a s relativně malou pravděpodobností nějakého přirozeného čísla. Většinou nás zajímá vliv vysvětlujících proměnných na rozdělení takové veličiny. Běžná rozdělení s nosičem na nezáporných celých číslech (Poissonovo, negativně binomické) se na modelování takových dat nehodí.
Zero-inflation models mají publikované aplikace v biologii, medicíně, psychologii, ekonomii a technometrii. Lze je použít i na problémy v oblasti finanční. Cílem práce je shrnout, vysvětlit a porovnat různé přístupy k formulaci, analýze a interpretaci modelů pro veličiny s nadbytečnými nulami. Práce může být doplněna simulační studií a/nebo analýzou reálných dat. |
Seznam odborné literatury |
Heilbron, D. C. Zero-altered and Other Regression-models For Count Data With Added Zeros. Biometrical Journal, 1994, 36, 531-547.
Lambert, D. Zero-inflated Poisson Regression, With An Application To Defects In Manufacturing. Technometrics, 1992, 34, 1-14. Welsh, A. H.; Cunningham, R. B.; Donnelly, C. F. & Lindenmayer, D. B. Modelling the abundance of rare species: Statistical models for counts with extra zeros. Ecological Modelling, 1996, 88, 297-308. Zeileis, A.; Kleiber, C. & Jackman, S. Regression models for count data in R. Journal of Statistical Software, 2008, 27, 8. |
Předběžná náplň práce |
Téma lze rozvinout různými směry podle zájmu a schopností studenta - např. rigoróznější odvození teoretických výsledků známých z literatury, jejich zobecnění a rozšíření na nové situace, porovnávání metod pomocí simulačních studií, přehled softwaru, implementace metod, které dosud v softwaru nejsou k dispozici, kreativní aplikace na
finanční data apod. Téma předpokládá absolvování předmětů NMST432 Pokročilé regresní modely a NMST434 Moderní statistické metody. |