Srovnání sekvenční a strukturních metod strojového učení pro predikci protein-ligand vazebných reziduí
Název práce v češtině: | Srovnání sekvenční a strukturních metod strojového učení pro predikci protein-ligand vazebných reziduí |
---|---|
Název v anglickém jazyce: | Comparison of sequence and structure-based machine learning approaches for protein-ligand binding residues |
Klíčová slova: | bioinformatika|protein|strojové učení|molekulární interakce |
Klíčová slova anglicky: | bioinformatics|protein|machine learning|molecular interactions |
Akademický rok vypsání: | 2022/2023 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | doc. RNDr. David Hoksza, Ph.D. |
Řešitel: | Bc. Prokop Divín - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 12.10.2022 |
Datum zadání: | 16.11.2022 |
Datum potvrzení stud. oddělením: | 25.11.2022 |
Datum a čas obhajoby: | 07.09.2023 09:00 |
Datum odevzdání elektronické podoby: | 21.07.2023 |
Datum odevzdání tištěné podoby: | 21.07.2023 |
Datum proběhlé obhajoby: | 07.09.2023 |
Oponenti: | Mgr. Petr Škoda, Ph.D. |
Zásady pro vypracování |
Proteiny jsou molekuly účastnící se prakticky všech dějů v živých organismech, přičemž funkce proteinu je odvozena od interakce s ostatními molekulami. Detekce vazebných míst proteinů tedy nachází uplanění v různých oblastech včetně počítačového návrhu léčiv. Obecně se bere jako fakt, že predikce vazebných míst z 3D struktury proteinu vede na lepší výsledky než predikce na základě sekvence. V minulých letech byla na MFF UK vyvinuta state-of-the-art metoda pro predikci protein-ligand vazebných míst ze struktury (P2Rank). Cílem této práce je implementovat sadu metod založených na strojovém učení pro predikci protein-ligand vazebných míst ze sekvence, porovnat jejich výkon s metodou P2Rank a ukázat nebo vyvrátit na konkrétních datech nadřazenost strukturních metod. |
Seznam odborné literatury |
1] Krivák, R. & Hoksza, D. (2018). "P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure." Journal of cheminformatics, 10, 1, BioMed Central
[2] Dallago, C., Schütze, K., Heinzinger, M., Olenyi, T., Littmann, M., Lu, A. X., Yang, K. K., Min, S., Yoon, S., Morton, J. T., & Rost, B. (2021). "Learned embeddings from deep learning to visualize and predict protein sets." Current Protocols, 1, e113 [3] Jones N.: An Introduction to Bioinformatics Algorithms, The MIT Press, 2004 [4] Liljas A., et al.: Textbook Of Structural Biology, World Scientific Publishing Company, 2009 |
Předběžná náplň práce v anglickém jazyce |
Proteins are involved in practically all events in living organisms with functions derived from interaction with other molecules. Therefore, the detection of protein binding sites finds application in various fields, including computer drug design. It is generally taken for granted that prediction of binding sites from the protein 3D structure leads to better results than prediction from its sequence. In recent years, a state-of-the-art method for predicting protein-ligand binding sites from the structure (P2Rank) was developed at MFF UK. The aim of this work is to implement a set of machine learning-based for the prediction of protein-ligand binding sites from a sequence, compare their performance with the P2Rank method and show or disprove the superiority of structure-based methods. |