Virtuální mobilita / počet míst pro virtuální mobilitu:
ne
Stav předmětu:
vyučován
Jazyk výuky:
angličtina
Vysvětlení:
Please follow the course web. First lesson takes place on Oct 11, 2023.Další informace včetně možností dálkového splnění části kursu viz stránky kursu.
Účastníci kursu získají základní dovednosti potřebné pro prohledávání, analýzu a interpretaci genomových dat za použití volně dostupných nástrojů (www, zdarma stažitelné programy).
Nezbytná je základní orientace v molekulární biologii (např. v rozsahu kursu B140P41) a základní počítačové dovednosti (Windows, WWW). Základní orientace v evoluční biologii je výhodou, avšak nikoli podmínkou.
Poslední úprava: Rubešová Jana, RNDr., Ph.D. (12.12.2006)
The course aims towards acquisition of basic skills required for searching and analysis of biological sequence data with the aid of commonly available (web-based or freely downloadable) tools.
Poslední úprava: Rubešová Jana, RNDr., Ph.D. (12.12.2006)
Literatura
http://kfrserver.natur.cuni.cz/bioinfo.html
Poslední úprava: Rubešová Jana, RNDr., Ph.D. (12.12.2006)
Požadavky ke zkoušce - angličtina
Presenting results of selected tasks (see course web pages) and answering control questions.
Poslední úprava: Cvrčková Fatima, prof. RNDr., Dr. (23.09.2020)
Sylabus -
1. Orientace ve zdrojích dat: databáze sekvencí, prohledávání, stahování souborů. Genomové a další specializované databáze. Nástroje pro získávání a zpracovávání dat.
2. Základní manipulace se sekvenčními daty. Výběr relevantních oblastí sekvence, formáty souborů, nástroje k jejich úpravě. Translace a in silico restrikční analýza DNA sekvencí.
3. Vyhledávání sekvencí na základě podobnosti. Metody - BLAST, FASTA. Teoretické principy metod. Substituční matice PAM a BLOSUM. Speciální verze programu BLAST.
4. Hledání motivů a analýza doménové struktury proteinů. SMART, PROSITE a podobné zdroje. Hledání specifických signálů (lokalizační a degradační signály v proteinech, vazebná místa na DNA). Hledání pomocí krátkých motivů (patterns), formáty motivů.
5. Identifikace genů a kódujících oblastí. Software pro hledání genů a predikci sestřihu.
6. Konstrukce a interpretace alignmentu. Automatické a manuální metody - porovnání CLUSTAL vs. MACAW. Využití EST sekvencí pro ověřování predikcí struktury genů. Odvozování proteinových motivů a profilů.
7. Konstrukce a kritická interpretace fylogenetických stromů. Problém smysluplné selekce dat. Programový balík PHYLIP.
Poslední úprava: Rubešová Jana, RNDr., Ph.D. (12.12.2006)
1. Orientation in data resources: sequence databases, searching, downloading. Genome sites and other "added value" resources. Tools for data access and manipulation.
2. Basic handling of sequence data. Identification of relevant sequence portions, file formats, reformatting utilities. Restriction site analysis and translation of DNA sequences.
3. Sequence similarity searches. Methods - BLAST, FASTA. Theoretical principles. Scoring matrices (PAM, BLOSUM). Special implementations of BLAST.
4. Motif searches and domain structure analysis. SMART, PROSITE and similar resources. Searching for specific signals (protein - localisation and degradation, DNA - binding sites). Pattern searches, pattern development.
5. Gene identification and gene building: algorithmic searching for coding sequences and intron/exon structures in chromosomal DNA.
6. Construction and interpretation of sequence alignments. Automated vs. manual methods (CLUSTAL vs. MACAW). Use of EST alignments for verifying gene structure predictions. Construction of protein sequence alignments and derived sequence patterns or profiles.
7. Phylogenetic trees: construction and critical interpretation. Problem of meaningful data selection. The PHYLIP package and its use.
Poslední úprava: Rubešová Jana, RNDr., Ph.D. (12.12.2006)
Výsledky učení - angličtina
After completing the practical course, the student will be able to, with the help of freely available software tools
perform basic manipulations with sequence data and routine sequence analyses (e.g. identification of protein-coding DNA regions, mapping of restriction sites, design of PCR primers)
search DNA and protein sequences in databases based on similarity and interpret the outputs of commonly used programs
identify functional motifs and known domains in protein sequences
search public databases of transcriptome data and further interpret the results of transcriptomic analyses
predict the secondary and tertiary structure of proteins and interpret the results of these predictions
create multiple alignments of protein sequences
create and critically interpret phylogenetic trees (including the identification of frequently occurring errors in the published literature).
Poslední úprava: Cvrčková Fatima, prof. RNDr., Dr. (23.01.2026)