Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Srovnání sekvenční a strukturních metod strojového učení pro predikci protein-ligand vazebných reziduí
Název práce v češtině: Srovnání sekvenční a strukturních metod strojového učení pro predikci protein-ligand vazebných reziduí
Název v anglickém jazyce: Comparison of sequence and structure-based machine learning approaches for protein-ligand binding residues
Klíčová slova: bioinformatika|protein|strojové učení|molekulární interakce
Klíčová slova anglicky: bioinformatics|protein|machine learning|molecular interactions
Akademický rok vypsání: 2022/2023
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. David Hoksza, Ph.D.
Řešitel: Bc. Prokop Divín - zadáno a potvrzeno stud. odd.
Datum přihlášení: 12.10.2022
Datum zadání: 16.11.2022
Datum potvrzení stud. oddělením: 25.11.2022
Datum a čas obhajoby: 07.09.2023 09:00
Datum odevzdání elektronické podoby:21.07.2023
Datum odevzdání tištěné podoby:21.07.2023
Datum proběhlé obhajoby: 07.09.2023
Oponenti: Mgr. Petr Škoda, Ph.D.
 
 
 
Zásady pro vypracování
Proteiny jsou molekuly účastnící se prakticky všech dějů v živých organismech, přičemž funkce proteinu je odvozena od interakce s ostatními molekulami. Detekce vazebných míst proteinů tedy nachází uplanění v různých oblastech včetně počítačového návrhu léčiv. Obecně se bere jako fakt, že predikce vazebných míst z 3D struktury proteinu vede na lepší výsledky než predikce na základě sekvence. V minulých letech byla na MFF UK vyvinuta state-of-the-art metoda pro predikci protein-ligand vazebných míst ze struktury (P2Rank). Cílem této práce je implementovat sadu metod založených na strojovém učení pro predikci protein-ligand vazebných míst ze sekvence, porovnat jejich výkon s metodou P2Rank a ukázat nebo vyvrátit na konkrétních datech nadřazenost strukturních metod.
Seznam odborné literatury
1] Krivák, R. & Hoksza, D. (2018). "P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure." Journal of cheminformatics, 10, 1, BioMed Central
[2] Dallago, C., Schütze, K., Heinzinger, M., Olenyi, T., Littmann, M., Lu, A. X., Yang, K. K., Min, S., Yoon, S., Morton, J. T., & Rost, B. (2021). "Learned embeddings from deep learning to visualize and predict protein sets." Current Protocols, 1, e113
[3] Jones N.: An Introduction to Bioinformatics Algorithms, The MIT Press, 2004
[4] Liljas A., et al.: Textbook Of Structural Biology, World Scientific Publishing Company, 2009
Předběžná náplň práce v anglickém jazyce
Proteins are involved in practically all events in living organisms with functions derived from interaction with other molecules. Therefore, the detection of protein binding sites finds application in various fields, including computer drug design. It is generally taken for granted that prediction of binding sites from the protein 3D structure leads to better results than prediction from its sequence. In recent years, a state-of-the-art method for predicting protein-ligand binding sites from the structure (P2Rank) was developed at MFF UK. The aim of this work is to implement a set of machine learning-based for the prediction of protein-ligand binding sites from a sequence, compare their performance with the P2Rank method and show or disprove the superiority of structure-based methods.
 
Univerzita Karlova | Informační systém UK