Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Ve čtvrtek dne 4. září 2025 v době od 20:00 do 22:00 dojde k odstávce webového prostředí a databáze systému WhoIs. Odstávka systému WhoIs se dotkne též systému IS Studium, zejména nebude možné odevzdávání závěrečných prací. Zápisy do předmětů by neměly být jakkoliv ovlivněny. Omlouváme se za komplikace a děkujeme všem, kterých se odstávka jakkoliv dotkne, za pochopení.
Support vector machines
Název práce v češtině: Support vector machines
Název v anglickém jazyce: Support vector machines
Klíčová slova: Support Vector Machines|binární klasifikace|jádrové metody|teorie statistického učení|empirické ověřování
Klíčová slova anglicky: Support Vector Machines|binary classification|kernel methods|statistical learning theory|empirical validation
Akademický rok vypsání: 2024/2025
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Vedoucí / školitel: doc. Mgr. Stanislav Nagy, Ph.D.
Řešitel: Vladyslav Zhuk - zadáno a potvrzeno stud. odd.
Datum přihlášení: 27.05.2024
Datum zadání: 28.05.2024
Datum potvrzení stud. oddělením: 28.05.2024
Datum odevzdání elektronické podoby:17.07.2025
Oponenti: doc. RNDr. Matúš Maciak, Ph.D.
 
 
 
Zásady pro vypracování
Riešiteľ(ka) sa zoznámi so základmi binárnej klasifikácie pomocou metódy Support Vector Machines, popíše jej základné princípy a uvedie príklady.
Seznam odborné literatury
Vapnik, V.N. 1995. The Nature of Statistical Learning Theory. New York: Springer Verlag.
Schölkopf, B., and Smola, A.J. 2002. Learning with Kernels. MIT Press, Cambridge.
Lin, Y. 2002. Support Vector Machines and the Bayes Rule in Classification. Data Mining and Knowledge Discovery, 6, 259–275.
Předběžná náplň práce
Základným problémom štatistiky a strojového učenia je tzv. binárny klasifikačný problém. V ňom pozorujeme dve skupiny dát, jednu napr. nameranú na zdravých jedincoch a druhú na pacientoch s ochorením. Na vstupe je ďalší pacient, ktorého hodnoty testov (tj. nové pozorovanie) sú známe. Nevieme ale, či je tento pacient zdravý alebo chorý (tj. z ktorého z dvoch rozdelení - zdraví/chorí - pacient pochádzal). Našou úlohou je rozhodnúť, či tento pacient patrí do skupiny chorých alebo zdravých pacientov. Tento problém sa nazýva problémom klasifikácie nového pozorovania (pacienta) do jednej z dvoch skupín (zdraví/chorí).

Populárnou modernou metódou klasifikácie je tzv. Support Vector Machines (SVM), v ktorom sa pozorované dáta v prvom kroku transformujú do vysoko-rozmerného priestoru, v ktorom sa v druhom kroku hľadá optimálna oddeľujúca nadrovina medzi skupinami pozorovaní. SVM dáva v praxi často až prekvapivo dobré výsledky. Jej matematické pozadie a implementácia však nie sú triviálne. Úlohou práce bude zoznámiť sa so základnými myšlienkami metódy SVM, popísať jej matematickú konštrukciu, a porovnať na príkladoch SVM s jednoduchšími klasifikačnými metódami.

Kvalitné spracovanie práce bude vyžadovať isté úsilie, a dobrú znalosť základov rôznych oborov matematiky.
 
Univerzita Karlova | Informační systém UK