PředmětyPředměty(verze: 804)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Strojové učení v bioinformatice - NAIL107
Anglický název: Machine Learning in Bioinformatics
Zajišťuje: Katedra softwaru a výuky informatiky (32-KSVI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2014
Semestr: letní
E-Kredity: 6
Rozsah, examinace: letní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Garant: RNDr. František Mráz, CSc.
Anotace -
Poslední úprava: G_I (23.05.2014)

Tradiční informatické postupy a algoritmy selhávají při řešení složitých biologických problémů. Při zpracování ohromného množství biologických dat se však dají využít metody strojového učení. Cílem přednášky je představit několik oblastí využití strojového učení při zpracování biologických dat. Přednáška předpokládá znalost základů bioinformatiky, které lze získat z přednášky Bioinformatické algoritmy NTIN084, nebo z podobných přednášek na jiných školách.
Literatura -
Poslední úprava: RNDr. František Mráz, CSc. (09.09.2015)

[1] Mitchell, T.: Machine Learning, McGraw Hill, 1997.

[2] Kinser, J.: Python for bioinformatics, Jones and Bartlett Publishers, Sudbury, Massachusetts, 2009

[3] Inza, I., Calvo, B., Armañanzas, R., Bengoetxea, E., Larrañaga, P., Lozano, J.A.: Machine learning: an indispensable tool in bioinformatics. Methods Mol Biol. 2010;593:25-48.

[4] Yang, Z. R.: Machine learning approaches to bioinformatics. Science, Engineering, and Biology Informatics - Vol. 4. World scientific, 2010

[5] Zhang, Y., Rajapakse, J. C.: Machine learning in bioinformatics. Wiley series on bioinformatics, Wiley, Hoboken, N.J., 2009

[6] Alpaydin, E.: Introduction to machine learning. 3rd ed., The MIT Press, 2014

Sylabus -
Poslední úprava: G_I (23.05.2014)

1. Předzpracování dat.

2. Jak porovnávat algoritmy učení.

3. Metody učení s učitelem: klasifikace (rozhodovací stromy, Bayesovké klasifikátory, logistická regrese, diskriminační analýza, metoda nejbližších sousedů, Support vector machines, neuronově sítě, kombinování klasifikátorů - boosting) a její aplikace v genomice, proteomice a systémové biologii.

4. Metody učení bez učitele: shluková analýza (klastrování dělením, k-means, hierarchické klastrování, validace klastrování) a jeji aplikace v bioinformatice.

5. Pravděpodobnostní grafické modely (Bayesovské sítě, Gaussovské sítě) a jejich aplikace (v genomice a systémové biologii).

6. Optimalizace a její aplikace v bioinformatice.

Přednáška je doplněná cvičením, kde se budou metody z přednášky aplikovat na umělá ale i na reálná biologická data. Při implementaci se bude používat především interaktivní programovací jazyk Python s knihovnami pro strojové učení a práci s biologickými daty.

 
Univerzita Karlova | Informační systém UK