Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Comparison of ITS nrDNA and alternative markers for fungal metabarcoding in environmental samples
Thesis title in Czech: Porovnání ITS nrDNA a alternativních markerů pro metabarcoding hub v environmentálních vzorcích
Thesis title in English: Comparison of ITS nrDNA and alternative markers for fungal metabarcoding in environmental samples
Key words: houby, sekvenování nové generace, Illumina, environmentální studie, diverzita, ekologie, molekulární marker, ITS1, ITS2, RPB2, ACT, EF-1α, MCM7
English key words: Fungi, High Throughput Sequencing, Illumina, Environmental Studies, Diversity, Ecology, Molecular Marker, ITS1, ITS2, RPB2, ACT, EF-1α, MCM7
Academic year of topic announcement: 2013/2014
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Genetics and Microbiology (31-140)
Supervisor: Mgr. Miroslav Kolařík, Ph.D.
Author: Mgr. Tomáš Zelenka - assigned by the advisor
Date of registration: 15.11.2013
Date of assignment: 15.11.2013
Date of electronic submission:14.08.2015
Date of proceeded defence: 15.09.2015
Opponents: RNDr. Tomáš Mašek, Ph.D.
 
 
 
Preliminary scope of work
Cíle řešení projektu:
Cílem práce je porovnat různé DNA markery pro odhad diverzity a abundance hub v environmentálních vzorcích. Za tímto účelem bude vytvořeno umělé společenstvo (mock community) sestávající se z genomické DNA hub napříč ekologickými a vývojovými liniemi hub. Dílčí cíle: 1. Poznání vnitrogenomové variability ITS oblasti. Poznání této variability bude mít přímý dopad na odhady diverzity hub získaných ze studií environmentálních vzorků pomocí NGS metod.2. Hledání vztahu mezi vnitrogenomovou variabilitou ITS oblasti a s ní související tendencí k mutačním změnám a úlohou v evoluci u různých zástupců hub s velkou šíří ekologie. Vzhledem k získaným informacím o relativních počtech rDNA klastrů bude možno demonstrovat jejich souvislost s ekologií hub a životními strategiemi u celé škály testovaných druhů.3. Zjistit použitelnost jedno-kopiových markerů. Konkrétně se bude zjišťovat specifičnost jednotlivých primerů k různým skupinám hub a dále také relativní počty kopií rDNA u jednotlivých skupin. Výsledky se porovnají diverzitními estimátory a posoudí se míra rizika nadhodnocení diverzity díky ITS paralogům. 4. Molekulární typizace a ověření taxonomického určení podstatné části kmenů ze sbírek hub CCF a CCBAS.
Způsob řešení:
Předpokládaný počet analyzovaných kmenů podle předběžného průzkumu bude čítat přibližně 500 houbových druhů napříč všemi významnými liniemi běžně kultivovaných hub. Výběr kmenů bude zacílen na půdní a endofytní houby, jakožto obyvatele nejčastěji studovaných hyperdiverzních substrátů. Do studie budou zařazeny kmeny ze sbírky hub na katedře botaniky PřF UK (Culture Collection of Fungi), kmeny získané v rámci projektů probíhajících na katedře botaniky (izoláty z půdy a opadu, endofyti rostlin), kmeny ze sbírek na MBÚ AV ČR jako je sbírka bazidiomycetů (http://www.biomed.cas.cz/ccbas/fungi.htm), sbírky Laboratoře genetiky a metabolizmu hub, Laboratoře biologie hub a Laboratoře environmentální mikrobiologie. Kmeny mykorhizních hub budou získány z laboratoře mykorrhizních symbióz Botanického Ústavu AV ČR, ze sbírky Ústavu ochrany lesa a myslivosti na Lesnické a dřevařské fakultě Mendelovy Univerzity v Brně a dále kmeny z herbářových položek Národního muzea v Praze (PRM). Od vybraných druhů hub bude analyzováno více kmenů (podle dostupnosti) z různých geografických lokalit. Nutným předpokladem pro začlenění do analýzy bude čistota kultury. Ta bude zaručena kultivací na příslušném médiu a monosporickou izolací. Izolace DNA bude provedena pomocí kitu ArchivePure DNA Yeast and Gram -+ Kit (5Prime), případně s drobnými modifikacemi podle potřeb konkrétního druhu. Pro získání konsenzuální sekvence ITS oblasti sloužící ke kontrolní typizaci poskytnutých kmenů (potřeba osekvenovat cca 10 % kmenů) bude provedeno přímé sekvenování na sekvenátoru Laboratoře sekvenace DNA biologické sekce PřF UK a u firmy Macrogen. Primární amplifikace ITS oblasti rDNA bude provedena pomocí standardně používaných universálních houbových primerů (White et al., 1990), případně jejich modifikovaných variant (Borneman et Hartin, 2000). Na odlišení sekvencí z různých druhů při samotné analýze dat z pyrosekvenace bude sloužit značení primárních amplikonů pomocí tzv. „tagovaných“ primerů (primer obsahuje krátkou oligonukleotidovou sekvenci). Na veškeré PCR amplifikace bude použita „proofreading and high-fidelity“ polymeráza zamezující vnášení polymorfizmů a vzniku chimér v průběhu amplifikační reakce (Lahr et Katz, 2009). Samotná sekvenace bude probíhat v sekvenačním centru firmy GeneTiCA technologií Illumina MiSeq. Získaná data budou podrobena standardní proceduře zpracování (Baldrian et al., 2011). To bude zahrnovat pročištění datasetu od sekvencí nesplňujících délkový limit, vyloučení sekvencí s odchylkou rozpoznávacím „tagu“ a s více jak jednonukleotidovou záměnou v amplifikačním primeru. Také bude dataset podroben analýze na výskyt chimér a jejich následnému odstranění. Pro statisticky pravděpodobný záchyt všech ITS kopií (rozptyl od 20-200 repetic na genom) analyzovaných kmenů bude potřeba získat 500-600 tisíc sekvencí, které zaručí pokrytí veškeré variability. Finální dataset bude zpětně rozdělen podle „tagu“ do skupin, které by hypoteticky měly obsahovat sekvence druhů do ní původně začleněné. Následně se pomocí homologního vyhledávání algoritmem Blast na základě konsenzuální sekvence získané přímým sekvenováním roztřídí sekvence náležící k jednomu druhu. Pak dojde k samotnému mapování částečných polymorfizmů (pSNP) (James et al., 2009) na konsenzuální sekvenci daného druhu. V potaz budou brány jen pSNP vyskytující se ve více než jedné kopii. Klastrování bude provedeno v programu CD-HIT a PlutoF. Sekvence výrazně odlišné od konsenzu pro daný druh (délkou a procentem variability) budou podrobeny postupu dle Feliner et Rosselló (2007), který umožňuje odhalení případného pseudogenu (např. na základě stability sekundární struktury ITS2). Ze získaných dat bude odvozena a dále diskutována propojenost mezi ekologií daného druhu a pozorované vnitrogenomové variability. Dále se bude kvantitativně porovnávat zastoupení jedno- a multi-kopiových markerů. Z tohoto porovnání se určí relativní zastoupení taxonů a pokud možno i relativní zastoupení repetic rDNA klastrů a vyhodnotí se jejich souvislost s ekologií a životní strategií jednotlivých skupin. Výsledky se porovnají s diverzitními estimátory a posoudí se míra rizika nadhodnocení diverzity díky vnitrogenomové variabilitě resp. přítomnosti ITS paralogů. Dále se určí univerzálnost a specifičnost jednotlivých primerů k různým skupinám hub pomocí údajů z definovaného společenstva a zvolí se nejvhodnější marker.
Preliminary scope of work in English
Nuclear ribosomal DNA (rDNA) and specifically ITS region is a crucial marker used for fungal determination and studies of relationship between fungal species. This region is also the most widely used gene for assessment of diversity in fungal communities. Commonly used direct sequencing may result in consensus sequence of all present copies. NGS methods produce sequences of individual parts of muti-copy marker region and frequent occurrence of intragenomic variability should results in diversity overestimation. Extent of intragenomic variability was studied so far in a few fungal species and information of greater phylogenetic extent is missing. On the other side use of ITS has a lot of disadvantages and there is a need to find alternative markers, especially single-copy markers which are useful for construction of phylogenetic trees of higher taxonomic resolution. The comparison of multi-copy and single-copy markers allows a relative estimation of species abundances in environmental samples and versatility of these primers suitable for metabarcoding. Minor objective is a typisation of strains from fungal collection using ITS primers.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html