The practical course includes lab work (part A), interpretation of the sequencer data and preparing data matrices (part B), data analysis (part C), and basics of next-generation (NGS) data analysis (part D).
A: Lab work - 2 days
A1. DNA sequencing
- PCR amplification of the target DNA region (non-coding cpDNA region, ITS…)
- agarose gel electrophoresis (test of successful PCR amplification)
- cleaning of PCR fragments using the kit
- PCR product quantification (spectrophotometrically)
- cycle sequencing using ABI PRISM BigDye Terminator v3.1 kit
- sequencing run at ABI 3100xl Avant (Biological section of the Faculty of Science)
A2. microsatellites
- use of specific nuclear primers (PCR reaction)
- use of universal chloroplast primers (PCR reaction)
- agarose gel electrophoresis (test of successful PCR amplification)
- PCR product precipitation, mixing with ROX internal standard
- fragment analysis run at ABI 3100xl Avant (Biological section of the Faculty of Science)
A3. NGS library preparation
- DNA sonication using Covaris M220, quality check using gel
- library preparation using NEBNext Ultra II kit
- library quantification using Qubit or LabChip
B: Sequencer data interpretation - 1 day
B1. DNA sequencing
- editing of sequences (FinchTV etc.)
- automatic alignment using ClustalX and MAFFT
- alignment editing, manipulation with sequences - BioEdit, FaBox
B2. microsatellites
- data analysis in GeneMarker
- interpreting stutter bands, -A addition etc., the building of data matrices
C: Data analysis - 1 day
C1. DNA sequencing
- searching for similar sequences in GenBank (BLAST)
- basic tree building (FastTree)
- statistic parsimony network - TCS
- building data matrices for subsequent analyses (NEXUS, PHYLIP format etc.), format conversion
C2. microsatellites
- basic data analyses (MicroSatelliteAnalyser)
D: Basic NGS data analysis - 1 day
- FASTQ sequences retrieval from short read archive (fastq-dump)
- data quality evaluation (FastQC), trimming (Trimmomatic), duplicate removal (fastuniq)
- read mapping to the reference (BWA)
- analysis of mapped reads (samtools, Tablet)
- de-novo assembly of chloroplast genome (Velvet)
- automated annotation (web GeSeq)
Last update: Štefánek Michal, Mgr. (31.05.2020)
Praktické cvičení zahrnuje práci v laboratoři (část A), interpretaci dat ze sekvenátoru a přípravu datových matic (část B), vyhodnocování dat (část C) a základní praktikum analýzy next-generation sequencing (NGS) dat (část D).
A: Laboratorní práce - 2 dny
A1. sekvenování DNA
- příprava a odladění PCR amplifikace požadovaného úseku DNA (nekódující úseky cpDNA, ITS…)
- otestování úspěšnosti amplifikace elektroforézou na agarosovém gelu
- přečištění PCR fragmentu pomocí kitu
- kvantifikace PCR produktu (změření koncentrace na spektrofotometru)
- vlastní sekvenační reakce (cycle sequencing) pomocí kitu ABI PRISM BigDye Terminator v3.1
- přečištění produktu, příprava pro analýzu na sekvenátoru
- použití automatického sekvenátoru ABI 3130xl Avant na biologické sekci PřF UK
A2. mikrosatelity
- použití specifických primerů pro jaderné mikrosatelity (PCR reakce)
- použití univerzálních pro chloroplastové mikrosatelity (PCR reakce)
- otestování úspěšnosti amplifikace elektroforézou na agarosovém gelu
- precipitace PCR produktů, příprava pro analýzu na sekvenátoru
- fragmentační analýza na sekvenátoru ABI 3100xl Avant na biologické sekci PřF UK
A3. příprava knihoven pro NGS
- sonikace DNA na přístroji Covaris M220, test na gelu
- příprava knihovny pomocí kitu NEBNext Ultra II
- kvantifikace knihovny na přístroji Qubit nebo LabChip
B: Interpretace dat ze sekvenátoru - 1 den
B1. sekvenování
- editace sekvenčních dat (FinchTV aj.) ze sekvenátoru, příprava pro alignment
- automatický alignment v programu ClustalX a MAFFT
- úprava alignmentu, manipulace se sekvencemi - BioEdit, FaBox
B3. mikrosatelity
- jednoduchá analýza získaných dat v programu GeneMarker
- vysvětlení problému se stutter bands, -A addition ad., příprava datové matice pro další analýzy
C: Analýza datových matic - 1 den
C1. sekvenování
- vyhledávání podobných sekvencí v GenBank (BLAST)
- základní tvorby stromů (FastTree)
- kodování indelů - SeqState
- statistické parsimonické sítě - TCS
- příprava datové matice pro další analýzy (NEXUS, PHYLIP formát ad.), konverze mezi formáty
C2. mikrosatelity
- základní analýza dat (MicroSatelliteAnalyser)
D: základní analýza NGS data - 1 den
- získávání FASTQ dat ze short read archive (fastq-dump)
- analýza a hodnocení kvality (FastQC), trimming (Trimmomatic), odstranění duplikátů (fastuniq)
- mapování readů na referenci (BWA)
- analýzy namapovaných readů (samtools, Tablet)
- de-novo assembly chloroplastového genomu (Velvet)
- automatická anotace (web GeSeq)
Last update: Štefánek Michal, Mgr. (31.05.2020)
|