Předpokladem úspěšného absolvování kurzu jsou základní znalosti matematické statistiky v rozsahu bakalářského kurzu OBPS13034 Statistika pro psychology (http://kps.pedf.cuni.cz/skalouda/skalouda.htm). Je průpravou pro kurz Diplomový seminář A (kvantitativní). Poskytuje hlubší pohled na základní pojmy z oblasti testování - objektivitu, validitu, reliabilitu a diskriminaci. Tím je dána jeho spojitost s kurzy Diagnostika v psychologickém poradenství, Diagnostika dětí a Diagnostika dospělých. Kurz je nutnou podmínkou pro vypracování diplomové práce založené na kvantitativní metodologii zpracování dat.
Poslední úprava: SKALOUDA/PEDF.CUNI.CZ (04.06.2015)
Cíl předmětu
Základní orientace v použití vícerozměrných statistických metod a v jejich počítačových výstupech.
Poslední úprava: SKALOUDA/PEDF.CUNI.CZ (20.09.2010)
Literatura
ANDĚL, J. Matematická statistika. Praha: SNTL/Alfa, 1978. BŘICHÁČEK, V.; KOŽENÝ, J. Metodologické problémy užití faktorové analýzy v psychologickém výzkumu. In Psychologie v ekonomické praxi, 1981, roč. XVI, č. 4, s. 175-186. COHEN, J. Statistical Power Analysis for the Social Sciences. Hillsdale, NY: Lawrence Erlbaum, 1988. CRONBACH, L.J. Essentials of psychological testing. New York: Harper & Row, 1970. GUILFORD, J.P.; FRUCHTER, B. Fundamental Statistics in Psychology and Education. New York: McGraw Hill, 1978. HEBÁK, P.; HUSTOPECKÝ, J. Vícerozměrné statistické metody s aplikacemi. Praha: SNTL/Alfa, 1987. HENDL, J. Přehled statistických metod zpracování dat. Praha: Portál, 2006. KERLINGER, F.N. Základy výzkumu chování. Praha: SPN, 1972. McDONALD R.P. Faktorová analýza a příbuzné metody v psychologii. Praha: Academia, 1991. MITTENECKER, E. Plánování a statistické hodnocení experimentů. Praha: SPN, 1968. OSECKÁ, L. Typologie v psychologii : aplikace metod shlukové analýzy v psychologickém výzkumu. Praha: Academia, 2001. RAO, R.C. Lineární metody statistické indukce a jejich aplikace. Praha: Academia, 1987. ŘEHÁK, J.; ŘEHÁKOVÁ, B. Analýza kategorizovaných dat v sociologii. Praha: Academia, 1985. ŠKALOUDOVÁ, A. Statistika v pedagogickém a psychologickém výzkumu. Praha: PedF UK, 1998.
Poslední úprava: SKALOUDA/PEDF.CUNI.CZ (25.11.2014)
Sylabus
Vstupní test
1 Korelační analýza podrobněji viz http://kps.pedf.cuni.cz/skalouda/pokrocili/korelacni.htm
1.1 Pearsonův korelační koeficient Odhad a testování korelačního koeficientu Fisherova z-transformace Interval spolehlivosti pro korelační koeficient
1.2.Problém třetí proměnné v korelační analýze Parciální korelační koeficient Další možnosti ovlivnění výše korelačního koeficientu: odlehlá pozorování nehomogenita souboru 1.3 Mnohonásobný koeficient korelace
1.4 Korelační koeficient pořadí Spearmanův korelační koeficient pořadí Kendallův koeficient pořadové korelace
1.5 Bodově biseriální korelační koeficient
1.6 Reliabilita podrobněji viz http://kps.pedf.cuni.cz/skalouda/pokrocili/reliabi.htm
Test - retest reliabilita Reliabilita paralelních měření Reliabilita zjištěná půlením testu Spearman - Brownovův vzorec Metody vnitřní konzistence Kuderůva-Richardsonův vzorec Cronbachovo alfa
1.7 Kriteriální validita
1.8 Objektivita testu Korelování výsledků vyhodnocení dvěma hodnotiteli Kappa koeficient shody
1.9 Diskriminační schopnost testové úlohy podrobněji viz http://kps.pedf.cuni.cz/skalouda/pokrocili/Slovn.htm Diskriminace RIR Diskriminace Grafické vyjádření diskriminace
3 Faktorová analýza podrobněji viz http://kps.pedf.cuni.cz/skalouda/fa/index.htm
3.1 Vznik faktorové analýzy jako psychometrického modelu Zakladatelem je psycholog Charles Spearman, který se pomocí faktorové analýzy pokusil objasnit strukturu lidské inteligence společný faktor (obecná intelektová schopnost) a specifické faktory L.L.Thurstone - existence více faktorů Dlouho používána jen v psychologii, vyžaduje značné předmětné znalosti v aplikační oblasti, respektování předpokladů metody a určité praktické zkušenosti
3.2 Podstata a cíl Rozbor vzájemných závislostí proměnných na základě předpokladu, že tyto závislosti jsou důsledkem menšího počtu v pozadí stojících nezměřitelných veličin, které jsou označovány jako společné faktory Interpretovat faktory podle toho, jaké proměnné obsahují Shrnout variabilitu proměnných pomocí několika málo faktorů
3.3 Předpoklady Lineární závislost proměnných - vysvětluje se existencí společných faktorů a tzv. chybovými či specifickými faktory (rušivé/reziduální složky) Faktory jsou vzájemně nezávislé normované veličiny s nulovou střední hodnotou a rozptylem 1
3.4 Explorativní faktorová analýza Matematický model: Latentní (f) a manifestní (X) proměnné Xi = ai1 f1 + ai2 f2 + aim fm + ei, aij jsou faktorové váhy (zátěže) počet proměnných p větší než m (počet faktorů) odsud vyplývá nejednoznačnost řešení
3.5 Základní pojmy: - Korelační matice - KMO a Bartlettův test - Anti-image matice - Vysvětlení celkového rozptylu - Komunality - poskytují informaci o tom, jaká část variability proměnné je vysvětlena nalezenými faktory, tj.vyjadřují společný faktorový rozptyl příslušné proměnné, který je dán součtem čtverců faktorových zátěží; souvislost s koeficientem determinace; - Nerotovaná faktorová matice - má podobu, kterou většinou nelze interpretovat
3.6 Hlavní metody extrakce faktorů a) Metoda hlavních komponent a) Metoda hlavních os c) Metoda nejmenších čtverců d) Zobecněná metoda nejmenších čtverců e) Metoda maximální věrohodnosti
3. 7 Rotace faktorů Postup, při němž se faktory a faktorové zátěže transformují tak, aby výsledné řešení vykazovalo maximální věcnou interpretovatelnost ortogonální (pravoúhlá) - předpoklad nezávislosti faktorů kosá - předpoklad, že mezi faktory existuje korelace Faktorové zátěže se pokládají za hodné interpretace dosahují-li hodnoty alespoň 0,3, lépe 0,5. Faktorová zátěž rovna 1 znamená, že daná proměnná je zcela nasycena daným faktorem, tj. jde o faktorově čistou proměnnou Faktorová zátěž rovna 0 = proměnná není daným faktorem vůbec dotčena Různé postupy rotace faktorů mají za následek nejednoznačnost odhadů faktorových parametrů Nejpoužívanější kritérium rotace je princip jednoduché struktury (Thurstone) tak, aby -každá proměnná měla pokud možno vysoké faktorové zátěže u co nejmenšího počtu společných faktorů a nízké či středně vysoké zátěže u zbývajících faktorů Kdysi se provádělo graficky, nyní metody Varimax - minimalizuje počet proměnných, které mají u faktoru vysoké zátěže; zjednodušuje faktory Quartimax - minimalizuje počet faktorů potřebných k vysvětlení proměnné, většinou má za následek, že dostaneme 1 všeobecný faktor; zjednodušuje proměnné Equamax - kombinace obou předchozích metod Oblimin - kosá rotace pro závislé faktory
3.8 Interpretace faktorů Všeobecná praxe při interpretaci faktorů spočívá v tom, že popisujeme faktor jako něco, co je obsahově společné s těmi proměnnými, které mají u tohoto faktoru vysoké faktorové zátěže.
3.9 Faktorová skóre Závěrečnou etapou faktorové analýzy bývá odhad faktorového skóre, tj. stanovení hodnoty společných faktorů F1, F2, F3 ,… Fm pro každého z n pozorovaných jedinců. Faktorová skóre slouží jednak jako charakteristika sledovaných jedinců, jednak jako umělé proměnné pro další analýzy.
4 Shluková analýza podrobněji viz http://is.muni.cz/th/172767/fi_b/5739129/web/web/main.html
4.1 Cíle a podstata shlukové analýzy Roztřídění množiny objektů do několika poměrně stejnorodých shluků (klastrů, cluster) Vede k příznivým výsledkům tam, kde se studovaný soubor reálně rozpadá do tříd, pak se použitím SA podaří odhalit strukturu studované množiny objektů Je nutné najít vhodnou interpretaci pro daný rozklad Připouštějí se pouze rozklady s disjunktními shluky Podobnost pouze vzhledem k proměnným pojatým do zkoumání, proto je důležité, které proměnné zkoumáme Úlohy se zadaným a s nezadaným počtem shluků
4.2 Způsob posuzování podobnosti Funkcionály kvality rozkladu, tj. kritéria pro posouzení kvality rozkladu Matice vzdáleností - používáme podle toho, jak potřebujeme posílit vliv mimořádně odchýlených hodnot Hemmingova - součet abs. hodnot euklidovská Čebyševova maximální abs. hodnota Mahalanobisova vzdálenost - potlačuje i vliv rozdílů ve variabilitě Závislost na použitých měřicích jednotkách lze odstranit transformací proměnných
4.3 Postup na zadaném počítačovém výstupu 4.3.1 Aglomerativní hierarchický postup 1. Matice vhodných měr vzdálenosti 2. N shluků, tj. všechny objekty 3. Najdeme 2 shluky jejichž vzdálenost je minimální a spojíme je do jednoho shluku 4. Pokračujeme stejně jako v bodě 3, dokud nejsou všechny objekty spojeny do 1 shluku 4.3.2 Divizní hierarchický postup - opačný, začínáme od 1 shluku a končíme u jednotlivých objektů - méně častý 4.3.4 Centroidní metoda vybereme k zástupců centroidů (nezačínáme s n shluky) 4.3.3 Způsob hodnocení vzdálenosti mezi shluky a) Metoda nejbližšího souseda (jediné vazby) - nebezpečí vytvoření "mostů" i mezi velice vzdálenými objekty b) Metoda nejvzdálenějšího souseda (úplné vazby), odpadá řetězový efekt, tendence k vytváření malých kompaktních shluků c) Metoda průměrné vazby d) Centroidní metoda e) Wardova metoda - dosáhnout minimum celkového součtu čtverců (CSČ) odchylek všech hodnot od příslušných shlukových průměrů - změny jsou vodítkem pro tvorbu shluků 4.3.4 Grafické znázornění - podoba stromu - dendrogram
5 Intervaly spolehlivosti podrobněji viz http://kps.pedf.cuni.cz/skalouda/pokrocili/IS.doc
1. Koeficient spolehlivosti 2. Konstrukce intervalu spolehlivosti pro střední hodnoty 3. Přesnost a spolehlivost 4. Vztah mezi šířkou intervalu spolehlivosti a rozsahem výběru
Poslední úprava: SKALOUDA/PEDF.CUNI.CZ (20.11.2015)
Podmínky zakončení předmětu
1. Vstupní test ze základů testování hypotéz
2. Výstupní test z faktorové, shlukové a regesní analýzy
3. Ústní zkouška - diskuze k výše uvedeným testům
Poslední úprava: SKALOUDA/PEDF.CUNI.CZ (10.10.2013)