PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Course of work with molecular data in R - MB120C16
Anglický název: Course of work with molecular data in R
Český název: Kurz práce s molekulárními daty v R
Zajišťuje: Katedra botaniky (31-120)
Fakulta: Přírodovědecká fakulta
Platnost: od 2023
Semestr: zimní
E-Kredity: 2
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/5, Z [DS]
Počet míst: 30
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina
Další informace: https://trapa.cz/cs/kurz-molekularni-data-r-2024
Poznámka: povolen pro zápis po webu
Garant: Mgr. Vojtěch Zeisek, Ph.D.
Vyučující: Mgr. Vojtěch Zeisek, Ph.D.
Anotace -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (03.10.2023)
R je v současnosti asi nejmocnější a nejpoužívanější nástroj na výpočty všeho druhu. Je k dispozici i celá řada modulů pro práci s molekulárními daty. Jejich reprezentativní výběr je náplní kurzu.
Kurz obsahuje teorii použitých metod, tutoriály s použitím testovacích dat, úlohy pro samostatnou práci účastníků, a další. Cílem je naučit studenty analýzu molekulárních dat v programovacím jazyce R, představit dostupné balíčky pro jejich analýzu a praktické vyzkoušení si analýz vlastních nebo poskytnutých dat.
Předchozí znalost R je výhodou, nikoli však podmínkou. Nutná je alespoň minimální znalost molekulární biologie a vhodná je předchozí znalost alespoň některých metod analýz DNA dat. Kurz je vhodný spíše pro magisterské a doktorské studenty, pro bakalářské jen jsou-li velmi pokročilí.
Bude-li se kurzu účastnit alespoň jeden člověk nemluvící česky, kurz bude anglicky.
Kurz poběží turnusově 5 dnů, přičemž 4 dny poběží výuka a poslední den bude na zápočty a individuální konzultace. Tento poslední den účastníci mohou (což je vřele doporučeno), ale nemusí využít.
Kurz bude probíhat 29. 1.-2. 2. 2024 v Benátské 2 v učebně B12 od 9:00 do 16-17:00 (s dostatkem přestávek). Podle aktuální epidemiologické situace je možné, že kurz bude v hybridním módu (ne jen plně prezenčně) nebo plně on-line. Podrobnosti budou průběžně aktualizovány podle vývoje situace před kurzem.
Konzultace jsou možné kdykoliv po předchozí e-mailové domluvě.
Literatura -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (11.11.2021)
Požadavky ke zkoušce -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (03.05.2021)
  • Aktivní účast.
  • Kladení a zodpovídaní otázek v průběhu výuky týkajících se probíraných témat.
  • Načtení libovolných molekulárních dat (vlastních, vzorových z nějakého R balíčku, anebo z on-line databáze) a provedení několika vhodných analýz (podle typu dat), přičemž je možné při řešení využít internet, dokumentaci, apod.
  • Napsat na Wikipedii alespoň jednu normostranu o libovolném tématu souvisejícím s probíranými tématy. Může jít i o překlad, úpravy stávajícíh článků, o příspěvky do několika kratších článků, apod. Mělo by jít o jazykovou verzi Wikipedie odpovídající mateřskému jazyku studenta (tedy typicky českou nebo slovenskou verzi).
Sylabus -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (03.05.2021)

Přehled témat (může být upraven podle požadavků účastníků, rychlosti apod.):

  • Základy práce v R – jak se zadávají příkazy, instalují balíčky, čte se nápověda, typy proměnných, indexy apod.
  • Práce s Bioconductorem
  • Načítaní a exportování molekulárních dat různých typů a formátů.
  • Stažení sekvencí z databáze
  • Extrakce SNP ze sekvenačních dat
  • Extrakce polymorfismu ze sekvencí
  • Mikrosatelity, AFLP, SNP, sekvence, …
  • Alignment
  • Manipulace s daty, konverze mezi formáty
  • Tvorba distančních matic, import vlastních matic
  • Export dat
  • Základní statistiky
  • PCoA
  • Fylogenetické stromy (NJ, UPGMA, parsimonie), jejich zobrazení a testování
  • MSN
  • Základní statistika, genetické indexy, heterozygosita, HWE, F-statistika
  • Práce s celogenomovými SNP daty
  • DAPC
  • Prostorové analýzy – Mantel test, Moran’s I, Monmonier, sPCA, …
  • Základy tvorby map
  • Manipulace se stromy, zpracování většího množství stromů
  • Phylogenetic independent contrast
  • Phylogenetic autocorrelation
  • Phylogenetic PCA
  • Ancestral state reconstruction
  • Další rozšiřující témata…

Prostor pro další speciální otázky účastníků, zápočty a konzultace vlastních dat účastníků bude zejména během posledního dne.

Vstupní požadavky -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (12.10.2022)

Nebát se R. :-)

Předchozí znalost R je výhodou, nikoli však podmínkou. Nutná je alespoň minimální znalost molekulární biologie a vhodná je předchozí znalost alespoň některých metod analýz DNA dat. Doporučuji předem absolvovat předměty R pro život - MB162P13 a Use of molecular markers in plant systematics and population biology - MB120P44 (případně včetně praktik I a II), a Populační genetika rostlin - MB120P145, anebo jakékoliv obdobné.

Kurz je vhodný prvořadě pro magisterské a doktorské studenty, pro bakalářské studenty jen jsou-li velmi pokročilí.

Na kurz potřebujete

  • Vlastní notebook, na kterém budete pracovat.
  • Funkční připojení k Wi-Fi. Buď Eduroam (nastavte si jej pomocí fakultních nebo doporučených obecných instrukcí) nebo můžete v přihlášce požádat o dočasné jméno a heslo.
  • Nainstalované R. Doporučuji nainstalovat i grafické rozhraní RStudio, RKWard, R commander nebo jiné podobné dle vlastního výběru.
  • Pokud už máte zkušenosti s R, můžete si ušetřit práci tím, že si dopředu nainstalujete potřebné balíčky. Instrukce k tomu pošlu před kurzem. Pokud nechcete všechno instalovat, můžete použít předpřipravený linuxový obraz pro VirtualBox, kde je vše připraveno.
Požadavky k zápisu -
Poslední úprava: Mgr. Vojtěch Zeisek, Ph.D. (03.05.2021)

Zájemce o kurz prosím o vyplnění krátkého dotazníku, který mi pomůže s přípravou kurzu a komunikací.

 
Univerzita Karlova | Informační systém UK