Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Grafová reprezentace molekul a její využití ve virtuálním screeningu
Thesis title in Czech: Grafová reprezentace molekul a její využití ve virtuálním screeningu
Thesis title in English: Graph-based molecular representation and its utilization in virtual screening
Key words: graf; podobnost; chemická informatika; virtuální screening
English key words: graph; similarity; chemical informatics; virtual screening
Academic year of topic announcement: 2016/2017
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. David Hoksza, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 13.03.2017
Date of assignment: 15.03.2017
Confirmed by Study dept. on: 23.03.2017
Date and time of defence: 20.06.2017 00:00
Date of electronic submission:30.05.2017
Date of submission of printed version:19.05.2017
Date of proceeded defence: 20.06.2017
Opponents: RNDr. Michal Kopecký, Ph.D.
 
 
 
Guidelines
Virtuální screening (VS) je přístup k počítačové identifikaci bioaktivních sloučenin, kdy vstupem je knihovna (databáze) malých sloučenin a výstupem je setřídění této databáze podle pravděpodobnosti sloučenin vázat se na daný makromolekulární cíl. U ligand-based VS je knihovna prioritizována na základě podobnosti screenovaných sloučenin k jedné nebo více molekulám, o kterých je známo, že jsou schopny se na daný cíl vázat. Strukturu molekuly je možné přirozeně reprezentovat jako graf a podobnost molekul jako podobnost grafů. Vzhledem k velikosti screenovaných knihoven a časové náročnosti algoritmů pro určení grafové podobnosti se ovšem používá odvozená reprezentace, kdy je molekula reprezentována jako seznam fragmentů (podgrafů) molekuly, a podobnost pak odvozena od podobnosti dvou seznamů fragmentů. Cílem práce je prozkoumat možnosti reprezentace molekul pomocí plné grafové reprezentace a podobnostních měr založených na grafech a porovnat je z hlediska přesnosti i rychlosti se stávajícími state-of-the-art metodami reprezentace molekul pomocí fragmentů.
References
[1] Andrew R. Leach, V.J. Gillet (2007) An Introduction to Chemoinformatics. Springer
[2] Rajarshi Guha, Andreas Bender (2014) Computational Approaches in Cheminformatics and Bioinformatics. Wiley
[3] Jean-Loup Faulon, Andreas Bender. Handbook of Chemoinformatics Algorithms. Chapman and Hall/CRC; 1 edition, April 21, 2010
[4] Tudor I. Oprea. Chemoinformatics in Drug Discovery. John Wiley & Sons, 2006
Preliminary scope of work
Virtual screening (VS) is a method for in-silico identification of bioactive compounds where the input is a library (database) of small molecules and the output is a ranking of the database with respect to the probability of the input molecules to bind to the given macromolecular target. In ligand-based VS, the library is prioritized based on the similarity of the compounds being similar to one or more compounds for which their binding affinity to the target is already known. A molecular structure can be naturally represented as a graph and similarity of molecules as graph similarity. However, given the size of the screening libraries and time complexity of graph similarity algorithms, the commonly used representation of molecules is based on listing molecular fragments (subgraph) and similarity of molecules is based on similarity of these fragments lists. The goal of the thesis is to explore possibilities of representing molecules as full graphs and similarity measures based on graphs and compare them with respect to both effectivity and efficiency with the state-of-the-art fragment-based molecular representations.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html