Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře

Název práce v češtině:	Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Název v anglickém jazyce:	Training and validation and their impact on the classification accuracy: a case study on vegetation in the Krkonoše tundra
Akademický rok vypsání:	2022/2023
Typ práce:	diplomová práce
Jazyk práce:	čeština
Ústav:	Katedra aplikované geoinformatiky a kartografie (31-370)
Vedoucí / školitel:	doc. RNDr. Lucie Kupková, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	29.12.2022
Datum zadání:	08.01.2023
Datum potvrzení stud. oddělením:	13.01.2023
Konzultanti:	RNDr. Mgr. Jakub Lysák, Ph.D.

Předběžná náplň práce

Východiska/motivace/research gaps: Proces/způsob trénování a validace má zásadní vliv na výsledek hodnocení přesnosti klasifikace a jeho věrohodnost. Záleží též na typu a množství hodnocených klasifikačních tříd, typu land cover, zvolené klasifikační metodě a prostorovém rozlišení dat. Těmto zásadním krokům klasifikačního procesu není dosud v literatuře věnována dostatečná pozornost.
Pro trvalé plochy (100 x 100 m) s různými typy vegetace i širší plochu krkonošské tundry byl shromážděn unikátní soubor trénovacích/validačních botanických dat a obrazových optických dat UAS, která umožní testovat vliv procesu trénování a validace na výsledek hodnocení přesnosti klasifikace při použití různých klasifikátorů.
Cílem práce bude pro jednu, případně dvě prostorové úrovně
1) malé plochy s různým typem vegetace
2) úroveň širší tundry – méně TV dat

Vyhodnotit vliv některých z následujících faktorů na výsledek hodnocení přesnosti klasifikace multispektrálních dat s velmi vysokým prostorovým rozlišením:
- vliv velikosti vzorku a prostorového rozložení trénovacích a validačních dat
- vliv podílu trénovacích a validačních dat
- vliv použití bodů vs. polygonů na výsledek hodnocení přesnost klasifikace
- vliv malých a velkých tříd
- vliv oversampling a undersampling
- vliv termínu pořízení snímků
- případně další….

Hodnocení je možno provést pro různé klasifikátory, a porovnat, zda to pro ně funguje stejně nebo nikoliv. Doporučené klasifikátory – Support Vector Machine (mělo by teoreticky stačit menší množství dat) a Random Forest.
Rešerše bude zaměřená na metody trénování a validace (zejména validace) v DPZ.
V rámci práce budou připraveny a využity skripty zaměřené na hodnocení výše uvedených faktorů.… mnohonásobné spouštění klasifikací pomocí skriptů – vyhodnocení statistické významnosti různě nastavených parametrů trénování/validace na výsledek přesnosti hodnocení přesnosti klasifikace.
Možno zpracovat jen jednu fázi, tzn. hodnotit pouze proces trénování nebo pouze proces validace a též zvolit jen jeden klasifikátor.