Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Support vector machines
Thesis title in Czech: Support vector machines
Thesis title in English: Support vector machines
Key words: klasifikace|support vector machine|Bayesovo pravidlo|reprodukující jádro
English key words: classification|support vector machine|Bayes rule|reproducing kernel
Academic year of topic announcement: 2024/2025
Thesis type: Bachelor's thesis
Thesis language:
Department: Department of Probability and Mathematical Statistics (32-KPMS)
Supervisor: Mgr. Stanislav Nagy, Ph.D.
Author:
Guidelines
Riešiteľ(ka) sa zoznámi so základmi binárnej klasifikácie pomocou metódy Support Vector Machines, popíše jej základné princípy a uvedie príklady.
References
Vapnik, V.N. 1995. The Nature of Statistical Learning Theory. New York: Springer Verlag.
Schölkopf, B., and Smola, A.J. 2002. Learning with Kernels. MIT Press, Cambridge.
Lin, Y. 2002. Support Vector Machines and the Bayes Rule in Classification. Data Mining and Knowledge Discovery, 6, 259–275.
Preliminary scope of work
Základným problémom štatistiky a strojového učenia je tzv. binárny klasifikačný problém. V ňom pozorujeme dve skupiny dát, jednu napr. nameranú na zdravých jedincoch a druhú na pacientoch s ochorením. Na vstupe je ďalší pacient, ktorého hodnoty testov (tj. nové pozorovanie) sú známe. Nevieme ale, či je tento pacient zdravý alebo chorý (tj. z ktorého z dvoch rozdelení - zdraví/chorí - pacient pochádzal). Našou úlohou je rozhodnúť, či tento pacient patrí do skupiny chorých alebo zdravých pacientov. Tento problém sa nazýva problémom klasifikácie nového pozorovania (pacienta) do jednej z dvoch skupín (zdraví/chorí).

Populárnou modernou metódou klasifikácie je tzv. Support Vector Machines (SVM), v ktorom sa pozorované dáta v prvom kroku transformujú do vysoko-rozmerného priestoru, v ktorom sa v druhom kroku hľadá optimálna oddeľujúca nadrovina medzi skupinami pozorovaní. SVM dáva v praxi často až prekvapivo dobré výsledky. Jej matematické pozadie a implementácia však nie sú triviálne. Úlohou práce bude zoznámiť sa so základnými myšlienkami metódy SVM, popísať jej matematickú konštrukciu, a porovnať na príkladoch SVM s jednoduchšími klasifikačnými metódami.

Kvalitné spracovanie práce bude vyžadovať isté úsilie, a dobrú znalosť základov rôznych oborov matematiky.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html