Metody statistické inference založené na matici vzdáleností
Název práce v češtině: | Metody statistické inference založené na matici vzdáleností |
---|---|
Název v anglickém jazyce: | Distance-based testing |
Klíčová slova: | nepodobnost, testování založené na nepodobnostech, mnohorozměrná analýza, Mantelův test, test ANOSIM, test MRPP |
Klíčová slova anglicky: | dissimilarity, distance-based analysis, multivariate analysis, Mantel test, ANOSIM test, MRPP test |
Akademický rok vypsání: | 2009/2010 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | doc. Ing. Marek Omelka, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 12.10.2009 |
Datum zadání: | 12.10.2009 |
Datum a čas obhajoby: | 07.09.2011 00:00 |
Datum odevzdání elektronické podoby: | 03.08.2011 |
Datum odevzdání tištěné podoby: | 04.08.2011 |
Datum proběhlé obhajoby: | 07.09.2011 |
Oponenti: | prof. RNDr. Arnošt Komárek, Ph.D. |
Zásady pro vypracování |
Posluchač(ka) se seznámí s existujícími metodami testování statistických hypotéz, kde vstupem
je matice vzdáleností a pomocí simulací (a dle možnosti i analytických metod) prozkoumá postupy navržené v literatuře. |
Seznam odborné literatury |
Anderson, M. J. (2006). Distance-based tests for homogeneity of multivariate dispersions. Biometrics, 62:245-253.
Legendre, P. and Anderson, M. J. (1999). Distance-based redundancy analysis: testing multispecies responses in multifactorial ecological experiments. Ecol. Monogr., 69:1-24. Legendre, P. and Legendre, L. (1998). Numerical Ecology. Elsevier Science, Amsterdam. McArdle, B. H. and Anderson, M. J. (2001). Fitting multivariate models to community data: A comment on distance-based redundancy analysis. Ecology, 82:290-297. Mielke, P. W. and Berry, K. J. (2007). Permutation Methods, A distance function Approach. Springer, New York. Warton, D. I. and Hudson, H. M. (2004). A manova statistic is just as powerful as distance-based statistics, for multivariate abundances. Ecology, 85:858-874. |
Předběžná náplň práce |
Často je velmi obtížné najít realistický parametrický model pro mnohorozměrná data jako např. při zpracování TRFLP profilů či dat získáná pomocí microarrays. V těchto případech se data redukují na matici vzdáleností
(všech dvojic), která je mimojiné základem (v biologii a lékařství oblíbené) shlukové analýza. Ta však nedává odpověď na velmi mnoho otázek a její výstup je vpodstatě pouze grafický. V průběhu času bylo navrženo několik metod, jak testovat hypotézy na matici vzdáleností. Chybí však solidní výzkum vlastností těchto metod. |