Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Název práce v češtině: | Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře |
---|---|
Název v anglickém jazyce: | Training and validation and their impact on the classification accuracy: a case study on vegetation in the Krkonoše tundra |
Akademický rok vypsání: | 2022/2023 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra aplikované geoinformatiky a kartografie (31-370) |
Vedoucí / školitel: | doc. RNDr. Lucie Kupková, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 29.12.2022 |
Datum zadání: | 08.01.2023 |
Datum potvrzení stud. oddělením: | 13.01.2023 |
Konzultanti: | RNDr. Mgr. Jakub Lysák, Ph.D. |
Předběžná náplň práce |
Východiska/motivace/research gaps: Proces/způsob trénování a validace má zásadní vliv na výsledek hodnocení přesnosti klasifikace a jeho věrohodnost. Záleží též na typu a množství hodnocených klasifikačních tříd, typu land cover, zvolené klasifikační metodě a prostorovém rozlišení dat. Těmto zásadním krokům klasifikačního procesu není dosud v literatuře věnována dostatečná pozornost. Pro trvalé plochy (100 x 100 m) s různými typy vegetace i širší plochu krkonošské tundry byl shromážděn unikátní soubor trénovacích/validačních botanických dat a obrazových optických dat UAS, která umožní testovat vliv procesu trénování a validace na výsledek hodnocení přesnosti klasifikace při použití různých klasifikátorů. Cílem práce bude pro jednu, případně dvě prostorové úrovně 1) malé plochy s různým typem vegetace 2) úroveň širší tundry – méně TV dat Vyhodnotit vliv některých z následujících faktorů na výsledek hodnocení přesnosti klasifikace multispektrálních dat s velmi vysokým prostorovým rozlišením: - vliv velikosti vzorku a prostorového rozložení trénovacích a validačních dat - vliv podílu trénovacích a validačních dat - vliv použití bodů vs. polygonů na výsledek hodnocení přesnost klasifikace - vliv malých a velkých tříd - vliv oversampling a undersampling - vliv termínu pořízení snímků - případně další…. Hodnocení je možno provést pro různé klasifikátory, a porovnat, zda to pro ně funguje stejně nebo nikoliv. Doporučené klasifikátory – Support Vector Machine (mělo by teoreticky stačit menší množství dat) a Random Forest. Rešerše bude zaměřená na metody trénování a validace (zejména validace) v DPZ. V rámci práce budou připraveny a využity skripty zaměřené na hodnocení výše uvedených faktorů.… mnohonásobné spouštění klasifikací pomocí skriptů – vyhodnocení statistické významnosti různě nastavených parametrů trénování/validace na výsledek přesnosti hodnocení přesnosti klasifikace. Možno zpracovat jen jednu fázi, tzn. hodnotit pouze proces trénování nebo pouze proces validace a též zvolit jen jeden klasifikátor. |