PředmětyPředměty(verze: 873)
Předmět, akademický rok 2020/2021
  
Kurz práce s molekulárními daty v R - MB120C16
Anglický název: Course of work with molecular data in R
Český název: Kurz práce s molekulárními daty v R
Zajišťuje: Katedra botaniky (31-120)
Fakulta: Přírodovědecká fakulta
Platnost: od 2019
Semestr: zimní
E-Kredity: 2
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/4 Z [dny/semestr]
Počet míst: 35
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Další informace: https://trapa.cz/cs/kurz-molekularni-data-r-2020
Garant: Mgr. Vojtěch Zeisek, Ph.D.
Vyučující: Mgr. Vojtěch Zeisek, Ph.D.
Výsledky anket   Termíny zkoušek   Rozvrh   
Anotace -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (07.10.2019)
R je v současnosti asi nejmocnější a nejpoužívanější nástroj na výpočty všeho druhu. Je k dispozici i celá řada modulů pro práci s molekulárními daty. Ty budou náplní kurzu.
Kurz obsahuje teorii použitých metod, tutoriály s použitím testovacích dat, úlohy pro samostatnou práci účastníků, a další.
Předchozí znalost R je výhodou, nikoli však podmínkou. Nutná je alespoň minimální znalost molekulární biologie a vhodná je předchozí znalost alespoň některých metod analýz DNA dat.
Bude-li se kurzu účastnit alespoň jeden člověk nemluvící česky, kurz bude anglicky.
Kurz poběží turnusově 5 dnů, přičemž 4 dny poběží výuka a poslední den bude na zápočty a individuální konzultace. Tento poslední den účastníci mohou (což je vřele doporučeno), ale nemusí využít.
Kurz bude probíhat 27.-31. 1. 2020 v Benátské 2 v učebně B12 od 9:00 do 16-17:00 (s dostatkem přestávek).
Literatura -
Požadavky ke zkoušce -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (04.10.2017)
  • Aktivní účast.
  • Kladení a zodpovídaní otázek v průběhu výuky týkajících se probíraných témat.
  • Načtení libovolných molekulárních dat (vlastních, vzorových z nějakého R balíčku, anebo z on-line databáze) a provedení několika vhodných analýz (podle typu dat), přičemž je možné při řešení využít internet, dokumentaci, apod.
  • Napsat na Wikipedii alespoň jednu normostranu o libovolném tématu souvisejícím s probíranými tématy. Může jít i o překlad, úpravy stávajícíh článků, o příspěvky do několika kratších článků, apod. Mělo by jít o jazykovou verzi Wikipedie odpovídající mateřskému jazyku studenta (tedy typicky českou nebo slovenskou verzi).
Sylabus -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (23.09.2019)

Přehled témat (může být upraven podle požadavků účastníků, rychlosti apod.):

  • Základy práce v R - jak se zadávají příkazy, instalují balíčky, čte se nápověda, typy proměnných, indexy apod.
  • Práce s Bioconductorem
  • Načítaní a exportování molekulárních dat různých typů a formátů.
  • Stažení sekvencí z databáze
  • Extrakce SNP ze sekvenačních dat
  • Extrakce polymorfismu ze sekvencí
  • Mikrosatelity, AFLP, SNP, sekvence, ...
  • Alignment
  • Manipulace s daty, konverze mezi formáty
  • Tvorba distančních matic, import vlastních matic
  • Export dat
  • Základní statistiky
  • PCoA
  • Fylogenetické stromy (NJ, UPGMA, parsimonie), jejich zobrazení a testování
  • MSN
  • Základní statistika, genetické indexy, heterozygosita, HWE, F-statistika
  • Práce s celogenomovými SNP daty
  • DAPC
  • Prostorové analýzy - Mantel test, Moran’s I, Monmonier, sPCA, ...
  • Základy tvorby map
  • Ovládání Structure
  • Manipulace se stromy, zpracování většího množství stromů
  • Phylogenetic independent contrast
  • Phylogenetic autocorrelation
  • Phylogenetic PCA
  • Ancestral state reconstruction
  • Další rozšiřující témata...

Prostor pro další speciální otázky účastníků, zápočty a konzultace vlastních dat účastníků bude během posledního nepovinného dne.

Vstupní požadavky -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (23.09.2019)

Nebát se R. :-)

Předchozí znalost R je výhodou, nikoli však podmínkou. Nutná je alespoň minimální znalost molekulární biologie a vhodná je předchozí znalost alespoň některých metod analýz DNA dat. Doporučuji předem absolvovat předměty R pro život - MB162P13 a Use of molecular markers in plant systematics and population biology - MB120P44 (případně včetně praktik I a II), a Populační genetika rostlin - MB120P145, anebo jakékoliv obdobné.

Na kurz potřebujete

  • Vlastní notebook, na kterém budete pracovat.
  • Funkční připojení k Wi-Fi. Buď Eduroam (nastavte si jej pomocí fakultních nebo doporučených obecných instrukcí) nebo můžete v přihlášce požádat o dočasné jméno a heslo.
  • Nainstalované R. Doporučuji nainstalovat i grafické rozhraní RStudio, RKWard, R commander nebo jiné podobné dle vlastního výběru.
  • Pokud už máte zkušenosti s R, můžete si ušetřit práci tím, že si dopředu nainstalujete potřebné balíčky. Instrukce k tomu pošlu před kurzem.
Požadavky k zápisu -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (11.10.2016)

Zájemce o kurz prosím o vyplnění krátkého dotazníku, který mi pomůže s přípravou kurzu a komunikací.

 
Univerzita Karlova | Informační systém UK