Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Thesis title in Czech: | Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře |
---|---|
Thesis title in English: | Training and validation and their impact on the classification accuracy: a case study on vegetation in the Krkonoše tundra |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Applied Geoinformatics and Cartography (31-370) |
Supervisor: | doc. RNDr. Lucie Kupková, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 29.12.2022 |
Date of assignment: | 08.01.2023 |
Confirmed by Study dept. on: | 13.01.2023 |
Advisors: | RNDr. Mgr. Jakub Lysák, Ph.D. |
Preliminary scope of work |
Východiska/motivace/research gaps: Proces/způsob trénování a validace má zásadní vliv na výsledek hodnocení přesnosti klasifikace a jeho věrohodnost. Záleží též na typu a množství hodnocených klasifikačních tříd, typu land cover, zvolené klasifikační metodě a prostorovém rozlišení dat. Těmto zásadním krokům klasifikačního procesu není dosud v literatuře věnována dostatečná pozornost. Pro trvalé plochy (100 x 100 m) s různými typy vegetace i širší plochu krkonošské tundry byl shromážděn unikátní soubor trénovacích/validačních botanických dat a obrazových optických dat UAS, která umožní testovat vliv procesu trénování a validace na výsledek hodnocení přesnosti klasifikace při použití různých klasifikátorů. Cílem práce bude pro jednu, případně dvě prostorové úrovně 1) malé plochy s různým typem vegetace 2) úroveň širší tundry – méně TV dat Vyhodnotit vliv některých z následujících faktorů na výsledek hodnocení přesnosti klasifikace multispektrálních dat s velmi vysokým prostorovým rozlišením: - vliv velikosti vzorku a prostorového rozložení trénovacích a validačních dat - vliv podílu trénovacích a validačních dat - vliv použití bodů vs. polygonů na výsledek hodnocení přesnost klasifikace - vliv malých a velkých tříd - vliv oversampling a undersampling - vliv termínu pořízení snímků - případně další…. Hodnocení je možno provést pro různé klasifikátory, a porovnat, zda to pro ně funguje stejně nebo nikoliv. Doporučené klasifikátory – Support Vector Machine (mělo by teoreticky stačit menší množství dat) a Random Forest. Rešerše bude zaměřená na metody trénování a validace (zejména validace) v DPZ. V rámci práce budou připraveny a využity skripty zaměřené na hodnocení výše uvedených faktorů.… mnohonásobné spouštění klasifikací pomocí skriptů – vyhodnocení statistické významnosti různě nastavených parametrů trénování/validace na výsledek přesnosti hodnocení přesnosti klasifikace. Možno zpracovat jen jednu fázi, tzn. hodnotit pouze proces trénování nebo pouze proces validace a též zvolit jen jeden klasifikátor. |