Hledání tvarových odlehlostí ve funkcionálních datech
Thesis title in Czech: | Hledání tvarových odlehlostí ve funkcionálních datech |
---|---|
Thesis title in English: | Shape outliers detection for functional data |
Key words: | funkcionální data|tvarová odlehlost|hloubka dat |
English key words: | functional data|shape outliers|data depth |
Academic year of topic announcement: | 2023/2024 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Department of Probability and Mathematical Statistics (32-KPMS) |
Supervisor: | doc. RNDr. Daniel Hlubinka, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 14.12.2023 |
Date of assignment: | 20.12.2023 |
Confirmed by Study dept. on: | 20.12.2023 |
Guidelines |
Student/ka se seznámí s hloubkou dat pro funkcionální data. S využitím nedávno publikovaných prací se zaměří na různé definice a hledání tvarově odlehlých pozorování v kontextu funkcionálních dat. Prozkoumá teoretické vlastnosti těchto metod. V rámci práce se bude zabývat také problematikou klasifikace typů odlehlosti pro funkcionální data. |
References |
Stanislav Nagy, Irène Gijbels and Daniel Hlubinka (2017) Depth-Based Recognition of Shape Outlying Functions, Journal of Computational and Graphical Statistics, 26:4, 883-893, DOI: 10.1080/10618600.2017.1336445
George Wynne, Stanislav Nagy (2021) Statistical Depth Meets Machine Learning: Kernel Mean Embeddings and Depth in Functional Data Analysis. arXiv:2105.12778 preprint |
Preliminary scope of work |
Funkcionální data jsou formálně vzato "jen" náhodné objekty s nekonečně souřadnicemi. Fakticky je v nich ale obsažena informace o pořadí jednotlivých souřadnic, což je dáno jejich podstatou.
Pojem odlehlosti u funkcionálních dat je mnohem bohatší, než u náhodných veličin a náhodných vektorů s několika souřadnicemi. Základní odlehlost je samozřejmě ve smyslu polohy, ale můžeme mít i odlehlost s ohledem na trend, konvexitu, periodicitu, odlehlost funkcionálních dat se dá různě charakterizovat a klasifikovat. Úkolem práce je navázat na moderní výzkum v této oblasti, prozkoumat jednotlivé přístupy a jejich možné, výpočetně snad jednodušší, alternativy. Důraz práce může být kladen jak na teoretickou stránku problému směrem, kdy se metody budou zkoumat například s ohledem na jejich asymptotické vlastnosti, tak i více aplikovaným směrem, podle zájmu řešitele. |