R is nowadays probably the most powerful tool for calculations of all kinds. There are plenty of modules available for work with molecular data. Their representative selection will be introduced during the course.
The course contains theory of used methods, tutorials with test data, tasks for individual work of participants, and more. The aim is to teach students how to analyze molecular data in R programming language, introduce available packages for their analysis and practical trying out to work with own or provided data.
Previous knowledge of R is useful, but not necessary. At least basic knowledge of molecular biology is required, previous knowledge about any methods how to analyze DNA data is recommended. The course is aiming primarily to Master and Ph.D. students, for Bachelor students only if they are highly advanced.
The course will be taught 5 days, while 4 days are for teaching and last day is for exams and individual consultations. Course participants can stay this last day (which is recommended), but it is not conditional.
The course will be taught from January 29 to February 2 2024, Benátská 2, lecture room B12, from 9:00 to 16-17:00 (with enough breaks). Depending on epidemiological situation the course can be in hybrid mode (not only in full attendance) or fully on-line only. Details will be updated according to the situation prior the course.
Consultations are possible any time after previous e-mail agreement.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (09.09.2024)
R je v současnosti asi nejmocnější a nejpoužívanější nástroj na výpočty všeho druhu. Je k dispozici i celá řada modulů pro práci s molekulárními daty. Jejich reprezentativní výběr je náplní kurzu.
Kurz obsahuje teorii použitých metod, tutoriály s použitím testovacích dat, úlohy pro samostatnou práci účastníků, a další. Cílem je naučit studenty analýzu molekulárních dat v programovacím jazyce R, představit dostupné balíčky pro jejich analýzu a praktické vyzkoušení si analýz vlastních nebo poskytnutých dat.
Předchozí znalost R je výhodou, nikoli však podmínkou. Nutná je alespoň minimální znalost molekulární biologie a vhodná je předchozí znalost alespoň některých metod analýz DNA dat. Kurz je vhodný spíše pro magisterské a doktorské studenty, pro bakalářské jen jsou-li velmi pokročilí.
Bude-li se kurzu účastnit alespoň jeden člověk nemluvící česky, kurz bude anglicky.
Kurz poběží turnusově 5 dnů, přičemž 4 dny poběží výuka a poslední den bude na zápočty a individuální konzultace. Tento poslední den účastníci mohou (což je vřele doporučeno), ale nemusí využít.
Kurz bude probíhat 29. 1.-2. 2. 2024 v Benátské 2 v učebně B12 od 9:00 do 16-17:00 (s dostatkem přestávek). Podle aktuální epidemiologické situace je možné, že kurz bude v hybridním módu (ne jen plně prezenčně) nebo plně on-line. Podrobnosti budou průběžně aktualizovány podle vývoje situace před kurzem.
Konzultace jsou možné kdykoliv po předchozí e-mailové domluvě.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (09.09.2024)
Paurush Praveen Sinha, Bioinformatics with R Cookbook
Anthony R. Ives, Mixed and Phylogenetic Models: A Conceptual Introduction to Correlated Data, https://leanpub.com/correlateddata (free to read on-line)
Last update: Zeisek Vojtěch, Mgr., Ph.D. (11.11.2021)
Paurush Praveen Sinha, Bioinformatics with R Cookbook
Anthony R. Ives, Mixed and Phylogenetic Models: A Conceptual Introduction to Correlated Data, https://leanpub.com/correlateddata (zdarma k on-line čtení)
Last update: Zeisek Vojtěch, Mgr., Ph.D. (11.11.2021)
Requirements to the exam -
Active participation.
Asking and answering on-topic questions during the course.
Loading of any molecular data into R (own, exemplary data from some R package, or from on-line database) and doing several appropriate analysis (according to data type), it is possible to use Internet, documentation, etc.
Write to Wikipedia at least one page about any topic related to the course. It can be translation, edition of an existing page, it can be splitted into several articles, etc. Student should use native Wikipedia according to her/his language (so preferebly not English).
Last update: Zeisek Vojtěch, Mgr., Ph.D. (03.05.2021)
Aktivní účast.
Kladení a zodpovídaní otázek v průběhu výuky týkajících se probíraných témat.
Načtení libovolných molekulárních dat (vlastních, vzorových z nějakého R balíčku, anebo z on-line databáze) a provedení několika vhodných analýz (podle typu dat), přičemž je možné při řešení využít internet, dokumentaci, apod.
Napsat na Wikipedii alespoň jednu normostranu o libovolném tématu souvisejícím s probíranými tématy. Může jít i o překlad, úpravy stávajícíh článků, o příspěvky do několika kratších článků, apod. Mělo by jít o jazykovou verzi Wikipedie odpovídající mateřskému jazyku studenta (tedy typicky českou nebo slovenskou verzi).
Last update: Zeisek Vojtěch, Mgr., Ph.D. (03.05.2021)
Syllabus -
List of topics (might be edited according to wishes of participants, speed, etc.):
Basic work in R – how to enter commands, install packages, read help, types of variables, indexes, etc.
Bioconductor
Load and export molecular data of various types and formats.
Download molecular data from on-line databases
Extractions of SNP from sequencing data
Extraction of polymorphism from sequences
Mikrosatellites, AFLP, SNP, sequences, …
Manipulations with data, conversions among formats
Distance matrices, import of custom matrices
Export of data
Basic statistics
PCoA
Phylogenetic trees (NJ, UPGMA, ML) and display and test
MSN
Basic statistics, genetic indices heterozygosity, HWE, F-statistics
DAPC
Whole genome SNP data
Spatial analysis – Mantel test, Moran’s I, Monmonier, sPCA, …
Basic map creation
Alignments
Manipulations with trees, work with big sets of trees
Phylogenetic independent contrast
Phylogenetic autocorrelation
Phylogenetic PCA
Ancestral state reconstruction
Additional extending topics
There will be space available (especially during the last day) for another special questions of participants, exams and consultation of participants' own data (optional).
Last update: Zeisek Vojtěch, Mgr., Ph.D. (03.05.2021)
Přehled témat (může být upraven podle požadavků účastníků, rychlosti apod.):
Základy práce v R – jak se zadávají příkazy, instalují balíčky, čte se nápověda, typy proměnných, indexy apod.
Práce s Bioconductorem
Načítaní a exportování molekulárních dat různých typů a formátů.
Stažení sekvencí z databáze
Extrakce SNP ze sekvenačních dat
Extrakce polymorfismu ze sekvencí
Mikrosatelity, AFLP, SNP, sekvence, …
Alignment
Manipulace s daty, konverze mezi formáty
Tvorba distančních matic, import vlastních matic
Export dat
Základní statistiky
PCoA
Fylogenetické stromy (NJ, UPGMA, parsimonie), jejich zobrazení a testování
MSN
Základní statistika, genetické indexy, heterozygosita, HWE, F-statistika
Práce s celogenomovými SNP daty
DAPC
Prostorové analýzy – Mantel test, Moran’s I, Monmonier, sPCA, …
Základy tvorby map
Manipulace se stromy, zpracování většího množství stromů
Phylogenetic independent contrast
Phylogenetic autocorrelation
Phylogenetic PCA
Ancestral state reconstruction
Další rozšiřující témata…
Prostor pro další speciální otázky účastníků, zápočty a konzultace vlastních dat účastníků bude zejména během posledního dne.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (03.05.2021)
Working Wi-Fi. Eduroam (set it up using faculty or recommended general instructions) or in application form You can ask for temporary password.
Installed R. I also recommend to install some graphical user interface like RStudio, RKWard, R commander or some similar according to your choice.
If you have experience with R, you can save some work by installing required R packages in advance. I'll send instruction prior to the course. If You do not wish to install everything, You can use prepared Linux image for VirtualBox containing everything needed.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (12.10.2022)
Kurz je vhodný prvořadě pro magisterské a doktorské studenty, pro bakalářské studenty jen jsou-li velmi pokročilí.
Na kurz potřebujete
Vlastní notebook, na kterém budete pracovat.
Funkční připojení k Wi-Fi. Buď Eduroam (nastavte si jej pomocí fakultních nebo doporučených obecných instrukcí) nebo můžete v přihlášce požádat o dočasné jméno a heslo.
Nainstalované R. Doporučuji nainstalovat i grafické rozhraní RStudio, RKWard, R commander nebo jiné podobné dle vlastního výběru.
Pokud už máte zkušenosti s R, můžete si ušetřit práci tím, že si dopředu nainstalujete potřebné balíčky. Instrukce k tomu pošlu před kurzem. Pokud nechcete všechno instalovat, můžete použít předpřipravený linuxový obraz pro VirtualBox, kde je vše připraveno.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (12.10.2022)
Registration requirements -
I'd be glad if participants could fill a short questionary which will help me with preparation of the course and communication.
Last update: Zeisek Vojtěch, Mgr., Ph.D. (03.05.2021)