PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
UNIX and work with genomic data - MB170C47
Anglický název: UNIX and work with genomic data
Český název: UNIX a práce s genomickými daty
Zajišťuje: Katedra zoologie (31-170)
Fakulta: Přírodovědecká fakulta
Platnost: od 2023
Semestr: zimní
E-Kredity: 2
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/3, Z [DS]
Počet míst: 28
Minimální obsazenost: 10
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina
Poznámka: povolen pro zápis po webu
Garant: RNDr. Radka Reifová, Ph.D.
Vyučující: Mgr. Václav Janoušek, Ph.D.
RNDr. Libor Mořkovský, Ph.D.
RNDr. Radka Reifová, Ph.D.
Mgr. Anastasija Sedláková, Ph.D.
Anotace -
Poslední úprava: Ing. Jindřiška Peterková (12.09.2023)
Jak se biologický výzkum rozvíjí, pro většinu biologů jsou stále více důležité pokročilé výpočetní dovednosti a využití výkonných výpočetní zdroje. Nezbytným nástrojem je příkazový řádek Unixu, který je klíčový ke vzdálenému přístupu k výkonnějším výpočetním platformám. Nástroje jako git jsou navíc nepostradatelné pro reprodukovatelnost výzkumu, zajišťující konzistentnost a spolehlivost nálezů.

Představujeme zde aktualizovaný kurz se zaměřením na výpočty na vzdálených platformách a reprodukovatelnost kódu. Účastníci kurzu získají dostatečné dovednosti a sebevědomí v unixových prostředích, aby je mohli používat pro zpracování a analýzu vlastních genomických dat. Kromě mnoha praktických cvičení poskytneme také přehled dostupných výpočetních prostředí používaných v akademickém i komerčním prostředí v bioinformatice.
Sylabus -
Poslední úprava: RNDr. Jana Rubešová, Ph.D. (22.05.2018)

1. Úvod do prostředí Unix.

II. Základy Unixu - základní příkazy (cd, ls, ll, mkdir, mv, cp, pwd,

htop, screen, grep, globbing, less, head, tail, cat, cut, sort, uniq,

paste, join, pipes).

III. Pokročilý Unix - základy příkazů awk, sed, standardní výrazy, atd.

IV. Úvod do genomiky - struktura genomů.

V. Vizualizace dat - formátování dat pro jejich efektivní vizualizaci,

použití RStudio, tidyr, dplyr a ggplot2.

VI. Posouzení kvality sekvenčních genomových dat - FASTQ soubory.

VII. "Genome assembly" - jak propojit malé segmenty genomové informace.

VIII. Variantní procesy - použití originálních NGS readů a "genome

assembly" jejich variant.

IX. Standardní anotovací formáty - uložení a skladování genomové

informace (formáty GFF, VCF, BED), sumarizace dat (bedtools, vcftools)

X. Mnoho praktického procvičování.

 
Univerzita Karlova | Informační systém UK