Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Hledání tvarových odlehlostí ve funkcionálních datech
Thesis title in Czech: Hledání tvarových odlehlostí ve funkcionálních datech
Thesis title in English: Shape outliers detection for functional data
Key words: funkcionální data|tvarová odlehlost|hloubka dat
English key words: functional data|shape outliers|data depth
Academic year of topic announcement: 2023/2024
Thesis type: diploma thesis
Thesis language:
Department: Department of Probability and Mathematical Statistics (32-KPMS)
Supervisor: doc. RNDr. Daniel Hlubinka, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 14.12.2023
Date of assignment: 20.12.2023
Confirmed by Study dept. on: 20.12.2023
Guidelines
Student/ka se seznámí s hloubkou dat pro funkcionální data. S využitím nedávno publikovaných prací se zaměří na různé definice a hledání tvarově odlehlých pozorování v kontextu funkcionálních dat. Prozkoumá teoretické vlastnosti těchto metod. V rámci práce se bude zabývat také problematikou klasifikace typů odlehlosti pro funkcionální data.
References
Stanislav Nagy, Irène Gijbels and Daniel Hlubinka (2017) Depth-Based Recognition of Shape Outlying Functions, Journal of Computational and Graphical Statistics, 26:4, 883-893, DOI: 10.1080/10618600.2017.1336445

George Wynne, Stanislav Nagy (2021) Statistical Depth Meets Machine Learning: Kernel Mean Embeddings and Depth in Functional Data Analysis. arXiv:2105.12778 preprint

Preliminary scope of work
Funkcionální data jsou formálně vzato "jen" náhodné objekty s nekonečně souřadnicemi. Fakticky je v nich ale obsažena informace o pořadí jednotlivých souřadnic, což je dáno jejich podstatou.

Pojem odlehlosti u funkcionálních dat je mnohem bohatší, než u náhodných veličin a náhodných vektorů s několika souřadnicemi. Základní odlehlost je samozřejmě ve smyslu polohy, ale můžeme mít i odlehlost s ohledem na trend, konvexitu, periodicitu, odlehlost funkcionálních dat se dá různě charakterizovat a klasifikovat. Úkolem práce je navázat na moderní výzkum v této oblasti, prozkoumat jednotlivé přístupy a jejich možné, výpočetně snad jednodušší, alternativy.

Důraz práce může být kladen jak na teoretickou stránku problému směrem, kdy se metody budou zkoumat například s ohledem na jejich asymptotické vlastnosti, tak i více aplikovaným směrem, podle zájmu řešitele.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html