![]() | Ve čtvrtek dne 4. září 2025 v době od 20:00 do 22:00 dojde k odstávce webového prostředí a databáze systému WhoIs. Odstávka systému WhoIs se dotkne též systému IS Studium, zejména nebude možné odevzdávání závěrečných prací. Zápisy do předmětů by neměly být jakkoliv ovlivněny. Omlouváme se za komplikace a děkujeme všem, kterých se odstávka jakkoliv dotkne, za pochopení. |
Support vector machines
Název práce v češtině: | Support vector machines |
---|---|
Název v anglickém jazyce: | Support vector machines |
Klíčová slova: | Support Vector Machines|binární klasifikace|jádrové metody|teorie statistického učení|empirické ověřování |
Klíčová slova anglicky: | Support Vector Machines|binary classification|kernel methods|statistical learning theory|empirical validation |
Akademický rok vypsání: | 2024/2025 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Katedra pravděpodobnosti a matematické statistiky (32-KPMS) |
Vedoucí / školitel: | doc. Mgr. Stanislav Nagy, Ph.D. |
Řešitel: | Vladyslav Zhuk - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 27.05.2024 |
Datum zadání: | 28.05.2024 |
Datum potvrzení stud. oddělením: | 28.05.2024 |
Datum odevzdání elektronické podoby: | 17.07.2025 |
Oponenti: | doc. RNDr. Matúš Maciak, Ph.D. |
Zásady pro vypracování |
Riešiteľ(ka) sa zoznámi so základmi binárnej klasifikácie pomocou metódy Support Vector Machines, popíše jej základné princípy a uvedie príklady. |
Seznam odborné literatury |
Vapnik, V.N. 1995. The Nature of Statistical Learning Theory. New York: Springer Verlag.
Schölkopf, B., and Smola, A.J. 2002. Learning with Kernels. MIT Press, Cambridge. Lin, Y. 2002. Support Vector Machines and the Bayes Rule in Classification. Data Mining and Knowledge Discovery, 6, 259–275. |
Předběžná náplň práce |
Základným problémom štatistiky a strojového učenia je tzv. binárny klasifikačný problém. V ňom pozorujeme dve skupiny dát, jednu napr. nameranú na zdravých jedincoch a druhú na pacientoch s ochorením. Na vstupe je ďalší pacient, ktorého hodnoty testov (tj. nové pozorovanie) sú známe. Nevieme ale, či je tento pacient zdravý alebo chorý (tj. z ktorého z dvoch rozdelení - zdraví/chorí - pacient pochádzal). Našou úlohou je rozhodnúť, či tento pacient patrí do skupiny chorých alebo zdravých pacientov. Tento problém sa nazýva problémom klasifikácie nového pozorovania (pacienta) do jednej z dvoch skupín (zdraví/chorí).
Populárnou modernou metódou klasifikácie je tzv. Support Vector Machines (SVM), v ktorom sa pozorované dáta v prvom kroku transformujú do vysoko-rozmerného priestoru, v ktorom sa v druhom kroku hľadá optimálna oddeľujúca nadrovina medzi skupinami pozorovaní. SVM dáva v praxi často až prekvapivo dobré výsledky. Jej matematické pozadie a implementácia však nie sú triviálne. Úlohou práce bude zoznámiť sa so základnými myšlienkami metódy SVM, popísať jej matematickú konštrukciu, a porovnať na príkladoch SVM s jednoduchšími klasifikačnými metódami. Kvalitné spracovanie práce bude vyžadovať isté úsilie, a dobrú znalosť základov rôznych oborov matematiky. |