Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Predikce sekundární struktury proteinu pomocí hlubokých neuronových sítí
Thesis title in Czech: Predikce sekundární struktury proteinu pomocí hlubokých neuronových sítí
Thesis title in English: Protein secondary structure prediction using deep neural networks
Key words: bioinformatika; protein; sekundární struktura; strojové učení; neuronové sítě
English key words: bioinformatics; protein; secondary structure; machine learning; neural networks
Academic year of topic announcement: 2016/2017
Thesis type: diploma thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. David Hoksza, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 15.03.2017
Date of assignment: 15.03.2017
Confirmed by Study dept. on: 26.04.2017
Date and time of defence: 07.09.2017 10:00
Date of electronic submission:21.07.2017
Date of submission of printed version:21.07.2017
Date of proceeded defence: 07.09.2017
Opponents: Mgr. Filip Matzner
 
 
 
Guidelines
Sekundární struktura proteinu popisuje lokální uspořádání sousedících aminokyselin určené vodíkovými vazbami. Lze ji tedy využít, mimo jiné, jako mezikrok pro určení celého prostorového uspořádání proteinu, jehož znalost je klíčovou informací při zkoumaní vlastností a funkce daného proteinu, a tedy hraje důležitou roli např. při návrhu léku či enzymů. Strukturu proteinů je možné určit experimentálně, takový postup je ale nákladný a časově náročný, což dává prostor pro vznik programů, které dokáží strukturu předpovídat. Cílem této práce je vývoj vlastní implementace hluboké neuronové sítě pro predikci sekundární struktury proteinu na základě jeho primární struktury, tedy sekvence jednotlivých aminokyselin, ze kterých je protein složen. Součástí práce bude také srovnání se state-of-the-art metodami pro predikci sekundární struktury a zkoumaní vlivu různých parametrizací neuronové sítě a metod předzpracování vstupu.
References
[1] Liljas A., et al. (2009) Textbook Of Structural Biology, World Scientific Publishing Company
[2] Friedman, Jerome, Trevor Hastie, and Robert Tibshirani (2001) The elements of statistical learning. Vol. 1. Springer, Berlin: Springer series in statistics
[3] Ian Goodfellow and Yoshua Bengio and Aaron Courville (2016) Deep Learning, MIT Press
Preliminary scope of work
Protein secondary structure describes local geometry of neighboring amino acids defined by hydrogen bonds. The secondary structure can be used as an intermediate step for determination of protein's three-dimensional structure, which is a crucial information for analyzing properties and function of a given protein and therefore it is an important part of drug and enzyme design. Experimental determination of the protein structure is possible, but it is time-consuming and expensive. That increases a need for protein structure prediction tools. The goal of this thesis is to implement a deep neural network for secondary structure prediction using primary structure, i.e. sequence of protein's amino acids. The thesis will include comparison with current state-of-the-art methods and an examination of network fine-tuning and preprocessing methods.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html