Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře

Thesis title in Czech:	Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Thesis title in English:	Training and validation and their impact on the classification accuracy: a case study on vegetation in the Krkonoše tundra
Academic year of topic announcement:	2022/2023
Thesis type:	diploma thesis
Thesis language:	čeština
Department:	Department of Applied Geoinformatics and Cartography (31-370)
Supervisor:	doc. RNDr. Lucie Kupková, Ph.D.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	29.12.2022
Date of assignment:	08.01.2023
Confirmed by Study dept. on:	13.01.2023
Advisors:	RNDr. Mgr. Jakub Lysák, Ph.D.

Preliminary scope of work

Východiska/motivace/research gaps: Proces/způsob trénování a validace má zásadní vliv na výsledek hodnocení přesnosti klasifikace a jeho věrohodnost. Záleží též na typu a množství hodnocených klasifikačních tříd, typu land cover, zvolené klasifikační metodě a prostorovém rozlišení dat. Těmto zásadním krokům klasifikačního procesu není dosud v literatuře věnována dostatečná pozornost.
Pro trvalé plochy (100 x 100 m) s různými typy vegetace i širší plochu krkonošské tundry byl shromážděn unikátní soubor trénovacích/validačních botanických dat a obrazových optických dat UAS, která umožní testovat vliv procesu trénování a validace na výsledek hodnocení přesnosti klasifikace při použití různých klasifikátorů.
Cílem práce bude pro jednu, případně dvě prostorové úrovně
1) malé plochy s různým typem vegetace
2) úroveň širší tundry – méně TV dat

Vyhodnotit vliv některých z následujících faktorů na výsledek hodnocení přesnosti klasifikace multispektrálních dat s velmi vysokým prostorovým rozlišením:
- vliv velikosti vzorku a prostorového rozložení trénovacích a validačních dat
- vliv podílu trénovacích a validačních dat
- vliv použití bodů vs. polygonů na výsledek hodnocení přesnost klasifikace
- vliv malých a velkých tříd
- vliv oversampling a undersampling
- vliv termínu pořízení snímků
- případně další….

Hodnocení je možno provést pro různé klasifikátory, a porovnat, zda to pro ně funguje stejně nebo nikoliv. Doporučené klasifikátory – Support Vector Machine (mělo by teoreticky stačit menší množství dat) a Random Forest.
Rešerše bude zaměřená na metody trénování a validace (zejména validace) v DPZ.
V rámci práce budou připraveny a využity skripty zaměřené na hodnocení výše uvedených faktorů.… mnohonásobné spouštění klasifikací pomocí skriptů – vyhodnocení statistické významnosti různě nastavených parametrů trénování/validace na výsledek přesnosti hodnocení přesnosti klasifikace.
Možno zpracovat jen jednu fázi, tzn. hodnotit pouze proces trénování nebo pouze proces validace a též zvolit jen jeden klasifikátor.