Předmět prohlubuje a rozšiřuje znalosti pokročilých metod vícerozměrné analýzy dat. Zaměřuje se na představení vybraných metod, schopnost správně posoudit možnost jejich využití, ukázky aplikace a korektní vyhodnocení výsledků, včetně jejich prezentace. <br>
Seminář, organizován formou čtyř tříhodinových workshopů, je využit k praktickému nácviku vybraných metod ve statistickém softwaru.<br>
<br>
Přehled témat:<br>
1. Typologie vícerozměrných metod a základní popisné nástroje a grafy. Jemný úvod do geometrie ve<br>
více rozměrech.<br>
2. Analýza hlavních komponent (PCA), její geometrická interpretace a praktické použití.<br>
3. Faktorová analýza, teoretické předpoklady, geometrické důsledky, popis, interpretace a predikce.<br>
Vztah k PCA.<br>
4. Shluková analýza.<br>
5. Diskriminační analýza. Lineární, Fisherova, kvadratická. Úvod do klasifikačních úloh.<br>
6. Klasifikační a regresní stromy. Jemný nástin dalších nelineárních klasifikátorů (neuronové sítě a<br>
SVM). Hodnocení klasifikátorů.<br>
7. Mnohorozměrná regrese a základy zobecnění regresního modelování.<br>
8. Logistická regrese a její využití pro diskriminační úlohy.<br>
9. Log-lineární regrese a její využití pro analýzu kontingenčních tabulek.<br>
<br>
Seminární část probíhá formou čtyř 3hodinových workshopů. Předpokládané termíny v akademickém roce 2024/25: 5.3., 19.3., 2.4. a 16.4. (v případě změny budou studenti informováni emailem přes SIS.<br>
<br>
Poslední úprava: Podaná Zuzana, Mgr., Ph.D. (14.02.2025)
The course deepens and enlarges students' knowlege on advanced methods of multidimensional statistical analysis. <br>
Besines the introduction to the methods, the focus is on their proper choice, application and justification, as well as interpretation and presentation of the results.<br>
Seminary part (realized by four workshops (3 hours /each) serves for practical exercise in usage of the statistical software for the methods application. <br>
<br>
<br>
Repetitive enrollment is allowed.<br>
<br>
The following topics will be presented:<br>
1. Typology of multidimensional methods. Basic descriptive methods and graphs. Smooth introduction to multidimensional geometry. <br>
2. Principal Component Analysis}: geometry, interpretation and usage.<br>
3. Factor Analysis: theoretical assumptions, geometry, implications, description, interpretation and prediction. Relation to PCA.<br>
4. Cluster Analysis.<br>
5. Discriminant analysis. Linear, Fisher's, quadratic ... Introduction to classification.<br>
6. Classification and Regression Trees (CART). Slight introduction to other (non-linear) methods (neural networks, SVM). Measurement of classifiers' quality.<br>
7. Regression and Generalized Linear Models.<br>
8. Logistic regression.<br>
9. Log-lineár regression models and analysis of contingency tables.<br>
<br>
Poslední úprava: Podaná Zuzana, Mgr., Ph.D. (14.02.2025)
Literatura -
Agresti, A. (2007). An introduction to categorical data analysis. Wiley-Interscience.
Berka, P.: Dobývání znalostí z databází, Academia, Praha (2003).
Breiman, L; Friedman, J. H., Olshen, R. A., & Stone, C. J.: Classification and regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software, (1984)
Cohen, J. (Ed.). (2003). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences. Lawrence Erlbaum Associates.
Disman, M.: Jak se vyrábí sociologická znalost, Karolinum, Praha (2002)
Fox, J. (2015). Applied Regression Analysis and Generalized Linear Models (3rd Ed.). SAGE.
Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and Other Stories. Cambridge University Press.
Hebák, P. a kol.: Vícerozměrné statistické metody I-III. INFORMATORIUM, Praha, (2004 - 2005)
Harrington, D. (2009). Confirmatory Factor Analysis. Oxford University Press.
Hendl, J. (2012). Přehled statistických metod: Analýza a metaanalýza dat (4. vyd.). Portál.
Hox, J. J., Moerbeek, M., & Van de Schoot, R. (2017). Multilevel analysis: Techniques and applications. Routledge.
Littell, J. H., Corcoran, J., & Pillai, V. (2008). Systematic Reviews and Meta-Analysis. Oxford University Press.
Norusis, M. (2012). IBM SPSS Statistics 19 Advanced Statistical Procedures Companion. Pearson Education.
Norusis, M. (2012). IBM SPSS Statistics 19 Statistical Procedures Companion. Prentice Hall.
Peňa, D.: Análisis de datos multivariantes. McGraw-Hill, Madrid (2002)
Tabachnick, B. G., & Fidell, L. S. (2007). Using multivariate statistics. Pearson/Allyn & Bacon.
Venables, W. N. and Ripley, B. D.: Modern Applied Statistics with S. Springer-Verlag, New York(2002)
Thereneau, T.M. a Atkinson, E. J.: An Introdiction ro recursive Partitioning Using the RPARTRoutines. Mayo Foundation, (2011). Documentation to R-package.
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)
Agresti, A. (2007). An introduction to categorical data analysis. Wiley-Interscience.
Berka, P.: Dobývání znalostí z databází, Academia, Praha (2003).
Breiman, L; Friedman, J. H., Olshen, R. A., & Stone, C. J.: Classification and regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software, (1984)
Cohen, J. (Ed.). (2003). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences. Lawrence Erlbaum Associates.
Disman, M.: Jak se vyrábí sociologická znalost, Karolinum, Praha (2002)
Fox, J. (2015). Applied Regression Analysis and Generalized Linear Models (3rd Ed.). SAGE.
Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and Other Stories. Cambridge University Press.
Hebák, P. a kol.: Vícerozměrné statistické metody I-III. INFORMATORIUM, Praha, (2004 - 2005)
Harrington, D. (2009). Confirmatory Factor Analysis. Oxford University Press.
Hendl, J. (2012). Přehled statistických metod: Analýza a metaanalýza dat (4. vyd.). Portál.
Hox, J. J., Moerbeek, M., & Van de Schoot, R. (2017). Multilevel analysis: Techniques and applications. Routledge.
Littell, J. H., Corcoran, J., & Pillai, V. (2008). Systematic Reviews and Meta-Analysis. Oxford University Press.
Norusis, M. (2012). IBM SPSS Statistics 19 Advanced Statistical Procedures Companion. Pearson Education.
Norusis, M. (2012). IBM SPSS Statistics 19 Statistical Procedures Companion. Prentice Hall.
Peňa, D.: Análisis de datos multivariantes. McGraw-Hill, Madrid (2002)
Tabachnick, B. G., & Fidell, L. S. (2007). Using multivariate statistics. Pearson/Allyn & Bacon.
Venables, W. N. and Ripley, B. D.: Modern Applied Statistics with S. Springer-Verlag, New York(2002)
Thereneau, T.M. a Atkinson, E. J.: An Introdiction ro recursive Partitioning Using the RPARTRoutines. Mayo Foundation, (2011). Documentation to R-package.
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)
Metody výuky -
Realizace kursu v případě Distanční výuky
Výuka bude probíhat on-line dle rozvrhu zveřejněného na stánkách Katedry sociologie
Platforma on-line výuky: MS Teams (Teams Pokročilé statistické metody https://teams.microsoft.com/l/team/19%3a983d34f761ec4d4391fd45c93d60b4b1%40thread.tacv2/conversations?groupId=f06fe134-108b-48a9-bfb4-694a5def8677&tenantId=71cbe59b-f59f-49d8-bed9-6de6b6468917)
Studijní materiály: MS Teams (https://teams.microsoft.com/_#/school/files/Obecn%C3%A9?threadId=19%3A983d34f761ec4d4391fd45c93d60b4b1%40thread.tacv2&ctx=channel&context=slajdy&rootfolder=%252Fsites%252Felearning-Pokroilstatistickmetody%252FSdilene%2520dokumenty%252FGeneral%252Fslajdy)
Podmínky splnění: stejné, jako za běžných podmínek
Způsob atestace: písemný test může proběhnout on-line
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)
Realization of the course in case of distant study
The course will be held in line with the schedule published on the web of the Dept. of Sociology
On-line platform : MS Teams (Teams Pokročilé statistické metody https://teams.microsoft.com/l/team/19%3a983d34f761ec4d4391fd45c93d60b4b1%40thread.tacv2/conversations?groupId=f06fe134-108b-48a9-bfb4-694a5def8677&tenantId=71cbe59b-f59f-49d8-bed9-6de6b6468917)
Supporting materials: MS Teams (https://teams.microsoft.com/_#/school/files/Obecn%C3%A9?threadId=19%3A983d34f761ec4d4391fd45c93d60b4b1%40thread.tacv2&ctx=channel&context=slajdy&rootfolder=%252Fsites%252Felearning-Pokroilstatistickmetody%252FSdilene%2520dokumenty%252FGeneral%252Fslajdy)
Course graduation requests: the same as under the regular conditions
Typo of exam: written form, might be on-line
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)
Požadavky ke zkoušce -
V průběhu května/června budou vypsány dva termíny pro atestaci a jeden během záři. Konkrétní data budou upřesněna po dohodě se studenty. Podmínkou absolvovaní je dosažení alespoň 50% bodů v testu a účast na minimálně 3 workshopech.
Z důvodů karanténních opatření test může proběhnout i distanční formou, která bude upřesněna.
Zkoušku je možno skládat i v následujícím roce.
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)
Reaching at least 50% score in the final exam of written form is a necessary condition for passing the course as well as attendance on 3 workshops (at least).
There will be two exam dates given in May/June and one in September. Precise dates will be specified during the course.
in case of an epidemiology quaranteen, the exam might be proceed in a distant form.
The exam may be passed in the next year too.
Poslední úprava: Betinec Martin, Mgr., Ph.D. (05.02.2025)