Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Comparison of Approaches for Querying of Chemical Compounds
Název práce v češtině: Porovnání přístupů k dotazování chemických sloučenin
Název v anglickém jazyce: Comparison of Approaches for Querying of Chemical Compounds
Klíčová slova: Chemická databáze, Chemické sloučeniny, Benchmark, Hledání podgrafů, Grafová databáze, Izomorfismus podgrafů
Klíčová slova anglicky: Chemical database, Chemical Compounds, Benchmark, Subgraph querying, Graph database, Subgraph isomorphism
Akademický rok vypsání: 2015/2016
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. Irena Holubová, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 12.04.2016
Datum zadání: 26.04.2017
Datum potvrzení stud. oddělením: 02.05.2017
Datum a čas obhajoby: 17.06.2019 09:00
Datum odevzdání elektronické podoby:10.05.2019
Datum odevzdání tištěné podoby:10.05.2019
Datum proběhlé obhajoby: 17.06.2019
Oponenti: prof. RNDr. Jaroslav Pokorný, CSc.
 
 
 
Konzultanti: doc. RNDr. David Hoksza, Ph.D.
Zásady pro vypracování
Chemical compounds represent a unique type of a graph data set with a specific exploitation and querying. Currently there exist various approaches for storing and querying chemical compounds. They can be represented as general graphs or specific strings (e.g., in the SMILES format), queried using specific languages (e.g., the SMARTS language), indexed using specific indexes (e.g., GString) etc. The aim of the thesis is to describe, discuss and, in particular, experimentally compare the existing approaches for efficient storing and querying chemical compounds, including NoSQL graph databases and relational databases.
Seznam odborné literatury
Holubová, I. - Kosek, J. - Minařík, K. - Novák, D.: Big Data a NoSQL databáze. Grada, Praha, Česká republika, říjen 2015. ISBN 978-80-247-5466-6. [http://www.ksi.mff.cuni.cz/bigdata/]

PubChem http://pubchem.ncbi.nlm.nih.gov/

ZINC http://zinc.docking.org/

ChEMBL https://www.ebi.ac.uk/chembl/

SMILES - A Simplified Chemical Language. http://www.daylight.com/dayhtml/doc/theory/theory.smiles.html

SMARTS - A Language for Describing Molecular Patterns. http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html

Haoliang Jiang, Haixun Wang, Shuigeng Zhou: GString: A Novel Approach for Efficient Search in Graph Databases http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4221705

Sherif Sakr - Eric Pardede: Graph Data Management: Techniques and Applications

Vojtech Šípek: Vizuální dotazování v chemických databázích pomocí SMARTS vzorů. Bakalářská práce. MFF UK, 2014.
 
Univerzita Karlova | Informační systém UK