Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 341)
Detail práce
   Přihlásit přes CAS
Machine learning-based identification of separating features in molecular fragments
Název práce v češtině: Identifikace separujících vlastností molekulárních fragmentů pomocí strojového učení
Název v anglickém jazyce: Machine learning-based identification of separating features in molecular fragments
Klíčová slova: cheminformatika, strojové učení, molekulární reprezentace
Klíčová slova anglicky: cheminformatics, machine learning, molecular representation
Akademický rok vypsání: 2015/2016
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. David Hoksza, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 06.11.2015
Datum zadání: 27.11.2015
Datum potvrzení stud. oddělením: 29.03.2016
Datum a čas obhajoby: 31.01.2017 00:00
Datum odevzdání elektronické podoby:04.01.2017
Datum odevzdání tištěné podoby:03.01.2017
Datum proběhlé obhajoby: 31.01.2017
Oponenti: Mgr. Petr Škoda, Ph.D.
 
 
 
Zásady pro vypracování
Zvolená molekulární reprezentace je jedním z klíčových parametrů kamapní virtuálního screeningu, počítačové metody pro identifikaci aktivních molekul vzhledem k danéu makromolekulárnímu cíli. Většina z kampaní využívají molekulární reprezentaci, kdy je molekula reprezenatována s ohldem na přítomnost nebo absenci předdefinované sady topologických fragmentů. Tato informace je často obohacena o fyzikálně chemické vlastnosti těchto fragmentů, tzn. že reprezentace je schopná rozlišit fragmenty se stejnou topologií ale různými vlastnostmi. Nicméně každá molekulární reprezentace vždy využívá tu samou sadu vlastností nezávisle na cíli. Cílem práce je na základě znalosti známých aktivních a neaktivních molekul vzhledem k danému cíli vyhodnotit možnosti parametrizace fragmentové molekulrání reprezentace vlastnostmi (nebo jejich vahami) závisejícími na daném cíli. Studentovi bude poskytnuta generické molekulární reprezentace, cíle reprezentované množinami aktivních a neaktivních molekul a jeho/jejím cílem bude navrhnout přístup strojového učení, který by byl schopen identifikovat, které vlastnosti jsou relevantní pro daný cíl. Tato informace bude zakomponována do molekulární reprezentace a využita při virtuálním screeningu.

Chosen molecular representation is one of the key parameters of virtual screening campaigns where one is searching in-silico for active molecules with respect to given macromolecular target. Most of the campaigns employ molecular representation where a molecule is represented by presence or absence of a predefined set of topological fragments. Often, this information is enriched by physico-chemical features of those fragments, i.e. the representation distinguishes fragments with identical topology but different features. However, given molecular representation always uses the same set of features irrespective of the specific target. The goal of the thesis is, given a set of known active and inactive molecules with respect to a target, to study the possibilities of parameterization of a fragment-based molecular representation with features (of feature weights) dependent on given target. The student will be given a very general molecular representation, targets represented by sets of known active and inactive molecules, and his/her goal will be to propose a machine-learning approach which would identify which of the features are relevant for given target. This information will be fed into the representation and used in virtual screening.
Seznam odborné literatury
[1] David Hoksza, Petr Škoda. 2D Pharmacophore Query Generation. ISBRA, Central South University, Zhangjiajie, China, Springer, 2014
[2] Petr Škoda, David Hoksza. Exploration of Topological Torsion Fingerprints, BIBM Workshop on Health Informatics and Data Science (HI-DS), Washington, USA, IEEE, 2015
[3] Martin Šícho, Daniel Svozil, David Hoksza. Activity-Driven Exploration of Chemical Space with Morphing, International Workshop on Biomedical and Health Informatics, IEEE, 2015
[4] Andrew R. Leach, V.J. Gillet. An Introduction to Chemoinformatics. Springer, October 12, 2007
[5] Rajarshi Guha, Andreas Bender. Computational Approaches in Cheminformatics and Bioinformatics. Wiley, 2014
 
Univerzita Karlova | Informační systém UK