PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Maticové výpočty ve statistice - NMST442
Anglický název: Matrix Computations in Statistics
Zajišťuje: Katedra numerické matematiky (32-KNM)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2023
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D.
Třída: M Mgr. NVM
M Mgr. NVM > Volitelné
M Mgr. PMSE
M Mgr. PMSE > Povinně volitelné
Kategorizace předmětu: Matematika > Numerická analýza, Pravděpodobnost a statistika
Anotace -
Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (14.09.2013)
Tento předmět se věnuje statistickým metodám založených na maticových výpočtech, kde efektivní použití metod z numerické lineární algebry je rozhodující. Hlavní důraz je kladen na výběr a pochopení metod, které mají nízké výpočetní a paměťové nároky a jsou pokud možno stabilní a spolehlivé. Z počátku se výuka zaměří na statistické úlohy spojené s maticovým rozkladem SVD jako PCA, regrese, dimension reduction a small sample size problem (zejména v případě řídkých dat), pattern recognition a podobné klasifikační úlohy či problémy z oblastí data mining. V další výuce se budeme věnovat nezáporným maticovým rozkladům použitým například v text mining a výpočtům z numerické lineární algebry, které slouží k řešení problému page ranking pro internetové vyhledávače.
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)

Zápočet je za úspěšné zpracování úlohy v Matlabu. Úloha je podobná úlohám probraným na cvičení.

Literatura -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)

ELDEN, L.: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms, 4. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 2007.

BJORCK, ÅKE: Numerical Methods for Least Squares Problems. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 1996.

HIGHAM, N., STEWART, G. W.: Numerical Linear Algebra in Statistical Computing. The state of the art in numerical analysis (Birmingham, 1986), Inst. Math. Appl. Conf. Ser. New Ser., 9, Oxford Univ. Press, New York, 1987, pp. 41-57.

DUINTJER TEBBENS, J., SCHLESINGER, P.: Improving Implementation of Linear Discriminant Analysis for the High Dimension/Small Sample Size Problem, Computational Statistics and Data Analysis, 2007, vol. 52, no.1, pp. 423-437.

J. KALINA, J. DUINTJER TEBBENS: Metody pro redukci dimenze v mnohorozměrné statistice a jejich výpočet, to appear in the Informacní bulletin of the Czech Statistical Society, in 2014.

J. DUINTJER TEBBENS, I. HNĚTYNKOVÁ, M. PLEŠINGER, Z. STRAKOŠ and P. TICHÝ: Analysis of Methods for Matrix Computations, Basic Methods (in Czech), Matfyzpress Prague, ISBN 978-80-7378-201-6, first edition, 2012, 328 pp.

Metody výuky -
Poslední úprava: T_KPMS (12.05.2014)

Přednáška + cvičení.

Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)

Zkouška je písemná, většina otázek je typu multiple-choice až na jednu nebo dvě otázky, kde se vyžaduje podrobný popis. Zkoušena bude přednesená látka.

Sylabus -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)

1. Numerické vlastnosti SVD a spektrálního rozkladu.

2. PCA a spektrální rozklad.

3. (Multi)-Lineární regrese a SVD.

4. Redukce dimenze v mnohorozměrné statistice.

5. Pattern recognition a další klasifikační úlohy.

6. Nezáporné maticové rozklady.

7. Page ranking problem.

Vstupní požadavky -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)

Pouze velmi základní znalosti lineární algebry - další zejména numerické znalosti budou probrány během výuky.

 
Univerzita Karlova | Informační systém UK