Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Insights on Protein Conformational Diversity at the Ligand Binding Site Level
Název práce v češtině: Poznatky o konformační variabilitě proteinu na úrovni vazebného místa ligandu
Název v anglickém jazyce: Insights on Protein Conformational Diversity at the Ligand Binding Site Level
Klíčová slova: interakce, proteiny, krystalové kontakty, neuspořádané oblasti, apo-holo, struktura proteinu, ligandy, databáze, predikce
Klíčová slova anglicky: interactions, proteins, crystal contacts, prediction, disordered regions, apo-holo, protein structure, ligands, database
Akademický rok vypsání: 2017/2018
Typ práce: disertační práce
Jazyk práce: angličtina
Ústav: Katedra buněčné biologie (31-151)
Vedoucí / školitel: Mgr. Marian Novotný, Ph.D.
Řešitel: skrytý - zadáno vedoucím/školitelem
Datum přihlášení: 23.10.2017
Datum zadání: 23.10.2017
Datum odevzdání elektronické podoby:31.10.2024
Datum proběhlé obhajoby: 16.01.2025
Oponenti: David Bednář
  Gerardo Tauriello, Ph.D.
 
 
Předběžná náplň práce
Strukturní rozmanitost proteinů je důležitá pro studie, které modelují chování proteinů a jejich interakce. Oblast predikce vazebných míst ligandů urazila od počátků expertních systémů dlouhou cestu a algoritmy strojového učení dokážou abstrahovat data lépe než kdykoli předtím. Limitujícím faktorem prediktktivních metod je však zatím dostupnost dobře anotovaných a kvalitních a biologicky relevantních dat, které by bylo možné použít pro trémováni ve strojovém učení. Prediktivní modely napříč oborem jsou trénovány a testovány na holo konformacích proteinů vázaných na ligand, které vykazují pravidelné geometrie vazebných míst, jež lze naučit, ale nemusí odrážet fyziologický scénář, kdy se vazba ligandu projevuje vzorkováním nevázané geometrie proteinu. Studie predikce vazebných míst proteinových ligandů pro ionty, jako je zinek a hořčík, ukazuje, že prediktory strojového učení vyškolené a optimalizované na holo stavech mají tendenci dosahovat horších výsledků, když jsou konfrontovány s apo stavy.
Poté je představen softwarový postup pro vyhledávání alternativních vázaných a nevázaných stavů proteinů (AHoJ) podle uživatelem definované interakce protein-ligand, který je aplikován na všechny známé biologicky relevantní interakce malých molekul s ligandy v databázi Protein Data Bank. Výsledná databáze AHoJ-DB propojuje všechny alternativní konformace každého vazebného místa, klasifikuje každou konformaci jako apo nebo holo stav a kvantifikuje změny mezi nimi. Filtrační proces aplikovaný na AHoJ-DB vyhledává vazebná místa, která vykazují významný pohyb mezi svými apo a holo stavy, což představuje slepé místo pro prediktory vyškolené na jednotlivých holo stavech. Výsledný soubor dat, CryptoBench, obsahuje 1 361 kryptických vazebných míst a potvrzuje, že tyto cíle je obtížnější předpovídat pomocí stávajících metod.
Analýza AHoJ-DB ukazuje, že známý strukturní proteom se skládá z více osvětlených oblastí, kde jsou známy oba vazebné stavy (apo i holo), a méně osvětlených oblastí, kde je znám pouze jeden stav (holo). Dvě klíčová pozorování jsou, že apo stavy mají mnohem větší pravděpodobnost nepozorovaných nebo neuspořádaných zbytků ve vazebném místě a že dostupnost apo stavů se značně liší v závislosti na vázaném ligandu.
Předběžná náplň práce v anglickém jazyce
Protein structural diversity is relevant to studies that model protein behaviour and protein interactions. The field of ligand binding site prediction has come a long way since the early days of expert systems, with machine learning algorithms able to abstract data better than ever before. At the same time, biological data curation has yet to match this progress by providing large, curated datasets that reflect biological insights. Predictive models across the field are being trained and tested on holo protein conformations bound to a ligand, exhibiting regular binding site geometries that can be learned, but may not reflect the physiological scenario where ligand binding is manifested by sampling the unbound geometry of a protein. A protein ligand binding site prediction study for ions like zinc and magnesium, demonstrates that machine learning predictors trained and optimized on holo states, tend to underperform when confronted with apo states.
A software pipeline for retrieving alternative bound and unbound protein states (AHoJ) according to a user-defined protein-ligand interaction is then introduced and applied to all known biologically relevant small-molecule ligand interactions in the Protein Data Bank. The resulting database, AHoJ-DB, links all alternative conformations of each binding site, classifying each conformation as an apo or holo state and quantifying the change between them. A filtering process applied to AHoJ-DB finds binding sites that exhibit significant motion between their apo and holo states, representing a blind spot for predictors trained on single, holo states. The resulting dataset, CryptoBench, contains 1,361 cryptic binding sites and confirms that these targets are more difficult to predict using existing methods.
Analysis of AHoJ-DB reveals that the known structural proteome consists of more illuminated areas where both binding states are known (apo and holo) and less illuminated areas where only one state is known (holo). Two key observations are that apo states are much more likely to have unobserved or disordered residues in the binding site, and that the availability of apo states varies greatly depending on the bound ligand.
 
Univerzita Karlova | Informační systém UK