Použití neuronových sítí pro vývoj silových polí pomocí (NNFF) vhodných na zkoumání enzymatických chemických reakcí
Thesis title in Czech: | Použití neuronových sítí pro vývoj silových polí pomocí (NNFF) vhodných na zkoumání enzymatických chemických reakcí |
---|---|
Thesis title in English: | Development of neural network force fields (NNFFs) for exploration of enzymatic chemical reactions |
Key words: | enzymová katalýza, neuronové sítě, silová pole, reakční mechanismy |
English key words: | enzymatic catalysis, neural networks, force fields, reaction mechanisms |
Academic year of topic announcement: | 2025/2026 |
Thesis type: | dissertation |
Thesis language: | čeština |
Department: | Department of Physical and Macromolecular Chemistry (31-260) |
Supervisor: | prof. Mgr. Lubomír Rulíšek, DSc. |
Author: | |
Study form: | full-time |
Guidelines |
Modelování chemických reakcí v kondenzované fázi a enzymové katalýzy Kvantová chemie Klasická a kvantová molekulová dynamika |
References |
Unke, O. T.; Chmiela, S.; Sauceda, H. E.; Gastegger, M.; Poltavsky, I.; Schütt, K. T.; Tkatchenko, A.; Müller, K. Machine Learning Force Fields. Chem. Rev. 2021, 121, 10142-10186. doi:10.1021/acs.chemrev.0c01111 Wang, Y.; Wang, T.; Li, S.; He, X.; Li, M.; Wang, Z.; Zheng, N.; Shao, B.; Liu, T. Enhancing geometric representations for molecules with equivariant vector-scalar interactive message passing. Nat. Commun. 2024, 15, 313. doi:10.1038/s41467-023-43720-2 Frank, J. T.; Unke, O. T.; Müller, K.; Chmiela, S. A Euclidean transformer for fast and stable machine learned force fields. Nat. Commun. 2024, 15, 6539. doi:10.1038/s41467-024-50620-6 Anstine, D.; Zubatyuk, R.; Isayev, O. AIMNet2: A Neural Network Potential to Meet your Neutral, Charged, Organic, and Elemental-Organic Needs. ChemRxiv2024,. doi:10.26434/chemrxiv-2023-296ch-v3 Zhang, S.; Makoś, M. Z.; Jadrich, R. B.; Kraka, E.; Barros, K.; Nebgen, B. T.; Tretiak, S.; Isayev, O.; Lubbers, N.; Messerly, R. A.; Smith, J. S. Exploring the frontiers of condensed-phase chemistry with a general reactive machine learning potential. Nat. Chem. 2024, 16, 727-734. doi:10.1038/s41557-023-01427-3 |
Preliminary scope of work |
V posledních několika letech se úsilí mnoha výpočetních chemiků zaměřovalo na vytváření silových polí pro biologické molekuly, a to na základě strojového učení, jako je SpookyNet nebo AI2BMD. Ty v sobě spojují přesnost kvantově-chemických metod, avšak jsou o mnoho řádů rychlejší. Tyto modely se většinou zaměřovaly na nahrazení tradičních molekulově-mechanických (MM) silových polí, a méně zabývaly tím, aby byly přesné v režimu chemických reakcí, tedy pro případy, kdy se tvoří a zanikají chemické vazby. Kromě toho existuje třída modelů, jako například OrbNet nebo AIMNet2, které byly navrženy tak, aby byly univerzální. Cílem tohoto projektu bude ověřit, zda by bylo možné generováním rozsáhlého množství uvážlivě vybraných trénovacích dat vytvořit silová pole založené na neuronové síti (neural network force-field, NNFF), které by mohly urychlit zkoumání enzymových reakčních povrchů. Na základě datové sady PeptideCS, která je vyčerpávajícím mapováním hyperploch potenciální energie peptidů, bude hlavním výzkumným úkolem přijít s vhodnými trénovacími daty nejprve pro konkrétní enzymatickou reakci, jako je hydrolýza esterové vazby, a později studovat tzv. Paretovu frontu univerzality a přesnosti zahrnutím více skupin reakcí najednou, aby se nakonec dospělo k „univerzálnímu“ modelu. To bude zahrnovat návrh vhodných srovnávacích problémů, provedení referenčního výpočtu pomocí DFT, rozsáhlé generování trénovacích dat, trénování a modifikaci publikovaných modelů NN na vlastních souborech dat a vyhodnocení jejich výkonnosti. Konečným cílem bude o několik řádů snížit výpočetní náročnost ve výzkumu enzymové katalýzy a vytvořit tak obecně požívaný výpočetní nástroj pro širokou komunitu chemiků a biochemiků. |
Preliminary scope of work in English |
An intense research efforts in the last few years have focused on the generation of machine-learning force fields for biological molecules, such as SpookyNet or AI2BMD. These offer the accuracy of quantum-chemical methods with many orders of magnitude speedups. However, these models were mostly focused on replacing traditional MM force fields, so they were less concerned about being accurate in the regime of chemical reactions where bonds are formed and broken. On the other hand, some models, such as OrbNet or AIMNet2 were explicitly designed to be universal. The aim of this project will be to test if, by generating extensive amounts of judiciously chosen training data, it would be possible to generate NNFFs that could speed up exploration of enzymatic reaction landscapes. Building upon the PeptideCS dataset, which is and exhaustive mapping of non-reactive potential energy landscape of peptides, your task will be to come up with suitable training data for, at first, a particular enzymatic reaction, such as ester bond hydrolysis, and later studying the universality-accuracy Pareto front by including more groups of reactions at once, eventually arriving at "universal" model. This will involve designing suitable benchmark problems, running reference calculation by DFT, large-scale generation of training data, training and modifying published NN models on custom datasets, and evaluation of their performance. The ultimate goal will be to remove the computational time bottleneck in the exploration of enzymatic reactions. |