|
|
|
||
Tradiční informatické postupy a algoritmy selhávají při řešení složitých biologických problémů. Při zpracování ohromného
množství biologických dat se však dají využít metody strojového učení. Cílem přednášky je představit několik oblastí využití
strojového učení při zpracování biologických dat. Přednáška předpokládá znalost základů bioinformatiky, které lze získat z
přednášky Bioinformatické algoritmy NTIN084, nebo z podobných přednášek na jiných školách.
Poslední úprava: G_I (23.05.2014)
|
|
||||||||
A) Cvičení
V doprovodném Moodle-kurzu se budou postupně objevovat úkoly a testy.
Úkoly:
Každý úkol má stanovené datum odevzdání. Každý úkol bude učitelem oznámkován přidělením 0-10 bodů. Za celý semestr budou zadány 2 úkoly.
Typické řešení úkolu bude Jupyter notebook.
Upozornění: V případě, že bude zjištěno, že N≥2 posluchačů odevzdalo řešení, která se nápadně podobají nebo jsou zcela totožné, budou všechna tato řešení považována za jedno řešení. Toto řešení bude ohodnoceno B body podle jeho kvality, ale každý z těchto N řešitelů získá pouze dolní celou část z B/N bodů.
Testy:
Kromě úkolů, budou postupně zveřejňovány on-line testy. Za každý test lze získat maximálně 5 bodů. Za celý semestr budou zadány 2 on-line testy. Každý test bude mít stanovené datum, do kterého musí být vyřešen. Řešit test po tomto datu nebude možné.
Pro získání zápočtu je nutné:
Mezi výše uvedenými podmínkami nejsou uvedeny on-line testy. Na cvičeních lze získat dodatečné body
Body získané za celý semestr budou zkoušejícím započítány do celkové známky za předmět tak, aby tvořily 40% výsledného bodového hodnocení, ze kterého bude odvozena známka při zkoušce.
Získání zápočtu vyžaduje průběžnou práci přes celý semestr, a proto žádné náhradní termíny pro získání zápočtu nebudou vypsány.
B) Přednáška
Jak už bylo zmíněno výše, body získané z cvičení budou započítány s vahou 40% do celkového hodnocení posluchače. Samotná zkouška na konci semestru se započítá 60% do výsledného hodnocení. Posluchač získá známku na základě celkového hodnocení podle následující tabulky
Poslední úprava: Mráz František, RNDr., CSc. (17.02.2025)
|
|
||
[1] Mitchell, T.: Machine Learning, McGraw Hill, 1997. [2] Kinser, J.: Python for bioinformatics, Jones and Bartlett Publishers, Sudbury, Massachusetts, 2009 [3] Inza, I., Calvo, B., Armañanzas, R., Bengoetxea, E., Larrañaga, P., Lozano, J.A.: Machine learning: an indispensable tool in bioinformatics. Methods Mol Biol. 2010;593:25-48. [4] Yang, Z. R.: Machine learning approaches to bioinformatics. Science, Engineering, and Biology Informatics - Vol. 4. World scientific, 2010 [5] Zhang, Y., Rajapakse, J. C.: Machine learning in bioinformatics. Wiley series on bioinformatics, Wiley, Hoboken, N.J., 2009 [6] Alpaydin, E.: Introduction to machine learning. 3rd ed., The MIT Press, 2014 Poslední úprava: Mráz František, RNDr., CSc. (09.09.2015)
|
|
||
1. Předzpracování dat. 2. Jak porovnávat algoritmy učení. 3. Metody učení s učitelem: klasifikace (rozhodovací stromy, Bayesovké klasifikátory, logistická regrese, diskriminační analýza, metoda nejbližších sousedů, Support vector machines, neuronově sítě, kombinování klasifikátorů - boosting) a její aplikace v genomice, proteomice a systémové biologii. 4. Metody učení bez učitele: shluková analýza (klastrování dělením, k-means, hierarchické klastrování, validace klastrování) a jeji aplikace v bioinformatice. 5. Pravděpodobnostní grafické modely (Bayesovské sítě, Gaussovské sítě) a jejich aplikace (v genomice a systémové biologii). 6. Optimalizace a její aplikace v bioinformatice.
Přednáška je doplněná cvičením, kde se budou metody z přednášky aplikovat na umělá ale i na reálná biologická data. Při implementaci se bude používat především interaktivní programovací jazyk Python s knihovnami pro strojové učení a práci s biologickými daty. Poslední úprava: G_I (23.05.2014)
|