Předmět vás naučí základům strukturní bioinformatiky, která studuje principy výstavby biomolekul jako
prostorových útvarů. Dosahuje toho tvorbou nástrojů k jejich studiu, archivaci, popisu i předpovědím.
Předmět reflektuje nejnovější vývoj v oblasti hlubokého strojového učení a je rozšířen i o oblast protein
design, která se v poslední době aktivně rozvíjí. Pro úspěšné splnění předmětu jsou vhodné znalosti
základů operací v Unix shell.
Poslední úprava: Novotný Marian, Mgr., Ph.D. (05.09.2023)
Literatura
Základní učebnice: J. Gu; P. Bourne: Structural bioinformatics. Second edition, Wiley-Blackwell, Hoboken (2009). C Brandén; J. Tooze: Introduction to Protein Structure. Second Edition, Garland Publishing, New York (1998). Stephen Neidle, Mark Sanderson: Principles of Nucleic Acid Structure. Elsevier, Paperback ISBN: 9780128196779, eBook ISBN: 9780128196786. B. Rupp: Biomolecular Crystallography: Principles, Practice, and Application to Structural Biology. Garland Science, New York (2009). A.M. Lesk: Introduction to Bioinformatics. Oxford University, Oxford (2019). ISBN: 9780198794141 G. Rhodes: Crystallography made crystal clear. Elsevier, Amsterdam (2006). ISBN: 978-012587073-3 B. Alberts; A. Johnson; J. Lewis; M. Raff; K. Roberts; P. Walter: Molecular Biology of the Cell, W. W. Norton & Company, New York (2022). ISBN: 978-0393884852
Některá knižní díla dostupná zdarma na internetu:
http://www.ncbi.nlm.nih.gov/books/ Hlavní database a zdroje informací na webu: Strukturní databáze PDB: http://www.rcsb.org/pdb/ Databáze NCBI: http://www.ncbi.nlm.nih.gov/ Sekvenční databáze UniProt: http://www.uniprot.org/
Poslední úprava: Novotný Marian, Mgr., Ph.D. (05.09.2023)
Požadavky ke zkoušce
Cyklus přednášek končí zkouškou. Zkouška se skládá z písemné a ústní části. V rámci písemné části posluchač vyhledá zadané struktury (nebo třídy struktur), kriticky zhodnotí jejich kvalitu a diskutuje jejich hlavní rysy. Na jejich základě pak predikuje jinou strukturu a tu zkouší dále charakterizovat za pomoci dockingu a dalších metod. V ústní části je tyto výsledky nutné vysvětlit a závěry o kvalitě struktur obhájit. Součástí zkoušky je domácí úkol, jehož správnost, stejně jako další znalosti se testují u ústní zkoušky.
Potřebné SW vybavení: Praktická část probíhá s využitím webových nástrojů (prohlížeče firefox nebo založené na chrome) a částečně na vzdáleném linuxovém serveru dostupném přes SSH. Je tedy potřeba mít ssh klienta, ideálně veřejný klíč a funkční X forwarding (v linuxu nativně, pro win např. MobaXterm, na mac XQuartz). Základy práce v BASH výhodou.
Poslední úprava: Novotný Marian, Mgr., Ph.D. (05.09.2023)
Sylabus
Syllabus 1. Proč studovat struktury biomolekul. Vztahy struktura funkce v chemii a biologii. Formální popis trojrozměrných objektů. Stereochemie a struktura stavebních kamenů biomolekul, aminokyselin a nukleotidů.
2. Strukturní bioinformatika proteinů I. Vztah mezi aminokyselinovou sekvenci a strukturou proteinu. Metody porovnávání sekvencí a struktur, motivy terciární struktury, klasifikace proteinových foldů. Motiv, doména a fold.
3. Strukturní bioinformatika proteinů II. Strukturní alignment
4. Strukturní bioinformatika nukleových kyselin. I. Helikální konformace. Struktury komplexů proteinů s DNA.
5. Strukturní bioinformatika nukleových kyselin. II. Struktury RNA. Struktury komplexů proteinů s RNA.
6. Krystalografie jako hlavní zdroj znalosti molekulárních struktur. Krystalografický experiment, krystalizace, měření a vyhodnocení difrakce na monokrystalech. Symetrie krystalů, krystalografické grupy symetrie. Řešení a rafinace struktur. Porovnání dalších experimentálních metod stanovení molekulárních struktur, elektronové mikroskopie, NMR, a MS.
7. Validace (kontrola kvality) experimentálně stanovených molekulárních struktur, odhad přesnosti a správnosti. Slovníky valenční geometrie a strukturních motivů. Programové nástroje pro validaci makromolekul, off-line a na webu.
8. Databáze Protein Data Bank (PDB): Obsah databáze, formáty dat.: Architektura databáze, hledání v databázi.
9. Další specializované strukturní databáze nukleových kyselin (např. NAKB či Rfam), organických látek (CSD, Cambridge Structural Database). Další významné zdroje informací na webu a jejich použití (sekvenční a publikační databáze a jejich spojení se strukturními databázemi).
10. Základní metody porovnání molekulárních struktur. Nastínění statistických metod vhodných pro analýzy molekulárních struktur (hlavní komponenty, metody klastrování, grafická analýza dat v 1, 2 a 3 rozměrech). Zobrazování molekulárních struktur, základní programové vybavení.
11. Predikce 3D struktur proteinů - homologní modelování a jiné “tradiční metody”, metody porovnání kvality predikce struktur, CASP
12. Predikce 3D struktur II. - ab initio modelování, Alphafold a jím inspirované algoritmy - modelování kvarterní struktury
13. Design proteinů: Návrhy nových sekvencí a specifických funkcí úpravou existujících proteinů nebo z náhodných sekvencí za použití strojového učení. Porovnání s experimentálními metodami řízené evoluce jako je ribozómový displej nebo kvasinkový displej.
Poslední úprava: Novotný Marian, Mgr., Ph.D. (05.09.2023)
Výsledky učení
Po úspěšném absolvování kurzu student:
Odborné znalosti (Knowledge)
Vysvětlí formální a matematický popis trojrozměrných objektů, včetně stereochemie stavebních kamenů (aminokyseliny, nukleotidy) a principů symetrie krystalů (krystalografické grupy).
Definuje hierarchii proteinových struktur (motiv, doména, fold) a rozliší specifika konformací nukleových kyselin (DNA helikální formy, RNA struktury).
Popíše kompletní proces experimentálního stanovení struktury pomocí rentgenové krystalografie (od krystalizace po rafinaci) a porovná její limity s metodami NMR a kryo-elektronové mikroskopie.
Objasní principy algoritmů pro strukturní alignment a teoretické základy metod predikce struktur (od homologního modelování po ab initio a AlphaFold).
Rozebere rozdíly mezi metodami racionálního proteinového inženýrství (strojové učení) a experimentální řízenou evolucí (např. ribozomový displej).
Odborné dovednosti (Skills)
Vyhledá a extrahuje data nejen z PDB, ale i ze specializovaných databází pro nukleové kyseliny (NAKB, Rfam) a malé molekuly (CSD).
Aplikuje validační nástroje a slovníky valenční geometrie pro kontrolu kvality experimentálních i predikovaných struktur (identifikace chyb v geometrii, Ramachandranův diagram).
Využije statistické metody (analýza hlavních komponent - PCA, klastrování) pro analýzu konformačních souborů a klasifikaci molekulárních struktur.
Ovládá vizualizační software pro grafickou analýzu dat v 3D a provádí pokročilé operace se strukturami (superpozice komplexů protein-DNA/RNA).
Generuje predikce 3D struktur včetně kvarterní struktury (multimery) s využitím moderních nástrojů založených na hlubokém učení.
Umí hledat vazebné módy malých molekul v proteinech
Obecné způsobilosti (Kompetence)
Kriticky vyhodnotí přesnost a správnost strukturních dat na základě experimentálních parametrů (rozlišení, R-faktor) a validačních metrik.
Integruje znalosti sekvenčních a strukturních databází pro řešení komplexních biologických otázek (např. vliv mutace na stabilitu komplexu protein-DNA).
Navrhne strategii pro design proteinu s novou funkcí, přičemž zohlední výhody a nevýhody výpočetních přístupů oproti laboratorní evoluci.
Poslední úprava: Novotný Marian, Mgr., Ph.D. (04.02.2026)