Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Simplicial depth
Název práce v češtině: Simplexová hloubka
Název v anglickém jazyce: Simplicial depth
Klíčová slova: medián|kvantily|neparametrická analýza|simplexová hloubka|statistická hloubka|vícerozměrná analýza
Klíčová slova anglicky: median|quantiles|nonparametric analysis|simplicial depth|statistical depth|multivariate analysis
Akademický rok vypsání: 2022/2023
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Vedoucí / školitel: Mgr. Stanislav Nagy, Ph.D.
Řešitel: Bc. Erik Mendroš - zadáno a potvrzeno stud. odd.
Datum přihlášení: 25.10.2022
Datum zadání: 25.10.2022
Datum potvrzení stud. oddělením: 29.11.2022
Datum a čas obhajoby: 26.06.2023 09:00
Datum odevzdání elektronické podoby:10.05.2023
Datum odevzdání tištěné podoby:15.05.2023
Datum proběhlé obhajoby: 26.06.2023
Oponenti: doc. RNDr. Daniel Hlubinka, Ph.D.
 
 
 
Zásady pro vypracování
Riešiteľ(ka) sa zoznámi s pojmom simplexovej hĺbky viacrozmerných dát, prehľadne popíše jej základné vlastnosti, a uvedie príklady simplexovej hĺbky jednoduchých rozdelení.
Seznam odborné literatury
Liu, R. Y. (1990). On a notion of data depth based on random simplices. Ann. Statist., 18(1):405–414.
Liu, R. Y., Parelius, J. M., and Singh, K. (1999). Multivariate analysis by data depth: descriptive statistics, graphics and inference. Ann. Statist., 27(3):783–858.
Zuo, Y. and Serfling, R. (2000). General notions of statistical depth function. Ann. Statist., 28(2):461–482.
Předběžná náplň práce
Simplex v priestore R^d je konvexný obal (d+1) bodov (tj. trojuholník v R^2, alebo štvorsten v R^3). Uvažujme sadu n pozorovaní X={x_1, ..., x_n} a bod x v priestore R^d. Simplexová hĺbka bodu x voči dátam X je definovaná ako podiel počtu simplexov s vrcholmi v bodoch z množiny X ktoré obsahujú x, a celkového počtu simplexov tvorených X. Bod z R^d, ktorý dosahuje najvyššiu simplexovú hĺbku je tzv. simplexový medián. Ide o zovšeobecnenie mediánu pre dáta z priestoru R^d. Cieľom práce je popis základných vlastností simplexovej hĺbky a simplexového mediánu.

Musí v R^2 vždy existovať bod, ktorý je pokrytý aspoň 1/3 trojuholníkov s vrcholmi v dátach? Ak poznáme simplexovú hĺbku všetkých bodov, dokážeme zistiť, kde sa nachádzali pôvodné pozorovania X? Ak budú dáta X pochádzať z normálneho rozdelenia, vieme napočítať limitu simplexovej hĺbky bodu x pre rastúci počet pozorovaní n? Ako rýchlo spočítať simplexovú hĺbku bodu, alebo nájsť simplexový medián?
Předběžná náplň práce v anglickém jazyce
A simplex in the space R^d is the convex hull of (d+1) points (that is, a triangle in R^2 or a tetrahedron in R^3). Consider a collection of n observations X={x_1, ..., x_n} and a point x in R^d. The simplicial depth of x with respect to X is defined as the ratio of the number of simplices with vertices in the points from X, and the total number of simplices from X. A point in R^d that attains the highest simplicial depth is the so-called simplicial median. It is a generalization of a median for multivariate data. The goal of this work is the description of basic properties of the simplicial depth and the simplicial median.

Must there exist a point in R^2 that is covered by at least 1/3 of the triangle with vertices in the data points? If we know the simplicial depth of all points, can we determine the location of the observations X? If the data X comes from a multivariate normal distribution, can we express the limit of the simplicial depth of x for a growing sample size n? How to compute the simplicial depth of a point, or a simplicial median efficiently?
 
Univerzita Karlova | Informační systém UK