Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Detection of protein-ligand binding sites using graph neural networks
Thesis title in Czech: Využití grafových neuronových sítí pro detekci protein-ligand vazebných míst
Thesis title in English: Detection of protein-ligand binding sites using graph neural networks
Key words: bioinformatika|grafové neuronové sítě|protein|struktura
English key words: binding sites|protein-ligand binding sites|binding sites prediction|Graph Neural Networks|Graph Convolutional Networks|residue-level prediction|node features|protein|structure
Academic year of topic announcement: 2021/2022
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. David Hoksza, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 19.10.2021
Date of assignment: 19.10.2021
Confirmed by Study dept. on: 02.11.2021
Date and time of defence: 07.09.2022 09:00
Date of electronic submission:21.07.2022
Date of submission of printed version:24.07.2022
Date of proceeded defence: 07.09.2022
Opponents: Mgr. Martin Pilát, Ph.D.
 
 
 
Guidelines
Detekce protein-ligand vazebných míst je nejen důležitým nástrojem pro pochopení funkce proteinů, ale je využitelný i při detekci malých molekul schopných modifikovat funkci proteinu tj. nachází uplatnění i v rámci počítačového vývoje léčiv. Protein-ligand vazebná místa se dají detekovat jak na úrovni proteinové sekvence, tak na úrovni její 3D struktury. 3D struktura proteinu se dá reprezentovat jako graf s vrcholy odpovídajícím jendotlivým aminokyselinám, z kterých se protein skádá. Cílem práce je vyhodnotit možnosti aplikace grafových neuronových sítí pro detekci protein-ligand interakcí. V rámci práce by měly být vyhodnoceny jednotlivé architektury a reprezentace (embeddingy) pro vrcholy grafu (aminokyseliny). Součastí práce bude srovnání implementovaných přístupů s existujícími přístupy pro strukturní detekce protein-ligand vazebních míst, zvláště pak s nástrojem P2Rank, který je vyvíjen na Karlově Univerzitě.
References
[1] Krivák, R. & Hoksza, D. (2018). "P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure." Journal of cheminformatics, 10, 1, BioMed Central
[2] Dallago, C., Schütze, K., Heinzinger, M., Olenyi, T., Littmann, M., Lu, A. X., Yang, K. K., Min, S., Yoon, S., Morton, J. T., & Rost, B. (2021). "Learned embeddings from deep learning to visualize and predict protein sets." Current Protocols, 1, e113
[3] Hamilton, William L. (2020). "Graph representation learning." Synthesis Lectures on Artifical Intelligence and Machine Learning 14.3: 1-159.
Preliminary scope of work
Detekce protein-ligand vazebných míst je nejen důležitým nástrojem pro pochopení funkce proteinů, ale je využitelný i při detekci malých molekul schopných modifikovat funkci proteinu tj. nachází uplatnění i v rámci počítačového vývoje léčiv. Protein-ligand vazebná místa se dají detekovat jak na úrovni proteinové sekvence, tak na úrovni její 3D struktury. 3D struktura proteinu se dá reprezentovat jako graf s vrcholy odpovídajícím jendotlivým aminokyselinám, z kterých se protein skádá. Cílem práce je vyhodnotit možnosti aplikace grafových neuronových sítí pro detekci protein-ligand interakcí. V rámci práce by měly být vyhodnoceny jednotlivé architektury a reprezentace (embeddingy) pro vrcholy grafu (aminokyseliny). Součastí práce bude srovnání implementovaných přístupů s existujícími přístupy pro strukturní detekce protein-ligand vazebních míst, zvláště pak s nástrojem P2Rank, který je vyvíjen na Karlově Univerzitě.
Preliminary scope of work in English
The protein-ligand binding sites detection is not only an important tool for understanding protein function but also finds its application in the search for small molecules capable to modify protein function, i.e. in computational drug discovery. Protein-ligand binding sites can be detected either on the protein sequence or 3D structure levels. Protein structure can be represented as a graph with nodes corresponding to the individual protein amino acids. The goal of the thesis is to explore the possibilities of the application of graph neural networks for the detection of protein-ligand interactions. In the course of the project, the student should evaluate individual network architectures and node (amino acid) embeddings. An integral part of the project is also the evaluation of the implemented approaches in the context of existing state-of-the-art approaches for protein-ligand detection, especially with P2Rank a tool developed at Charles University.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html