Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Název práce v češtině: Proces trénování a validace a jejich vliv na přesnost klasifikace: případová studie zaměřená na vegetaci v krkonošské tundře
Název v anglickém jazyce: Training and validation and their impact on the classification accuracy: a case study on vegetation in the Krkonoše tundra
Akademický rok vypsání: 2022/2023
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra aplikované geoinformatiky a kartografie (31-370)
Vedoucí / školitel: doc. RNDr. Lucie Kupková, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 29.12.2022
Datum zadání: 08.01.2023
Datum potvrzení stud. oddělením: 13.01.2023
Konzultanti: RNDr. Mgr. Jakub Lysák, Ph.D.
Předběžná náplň práce
Východiska/motivace/research gaps: Proces/způsob trénování a validace má zásadní vliv na výsledek hodnocení přesnosti klasifikace a jeho věrohodnost. Záleží též na typu a množství hodnocených klasifikačních tříd, typu land cover, zvolené klasifikační metodě a prostorovém rozlišení dat. Těmto zásadním krokům klasifikačního procesu není dosud v literatuře věnována dostatečná pozornost.
Pro trvalé plochy (100 x 100 m) s různými typy vegetace i širší plochu krkonošské tundry byl shromážděn unikátní soubor trénovacích/validačních botanických dat a obrazových optických dat UAS, která umožní testovat vliv procesu trénování a validace na výsledek hodnocení přesnosti klasifikace při použití různých klasifikátorů.
Cílem práce bude pro jednu, případně dvě prostorové úrovně
1) malé plochy s různým typem vegetace
2) úroveň širší tundry – méně TV dat

Vyhodnotit vliv některých z následujících faktorů na výsledek hodnocení přesnosti klasifikace multispektrálních dat s velmi vysokým prostorovým rozlišením:
- vliv velikosti vzorku a prostorového rozložení trénovacích a validačních dat
- vliv podílu trénovacích a validačních dat
- vliv použití bodů vs. polygonů na výsledek hodnocení přesnost klasifikace
- vliv malých a velkých tříd
- vliv oversampling a undersampling
- vliv termínu pořízení snímků
- případně další….

Hodnocení je možno provést pro různé klasifikátory, a porovnat, zda to pro ně funguje stejně nebo nikoliv. Doporučené klasifikátory – Support Vector Machine (mělo by teoreticky stačit menší množství dat) a Random Forest.
Rešerše bude zaměřená na metody trénování a validace (zejména validace) v DPZ.
V rámci práce budou připraveny a využity skripty zaměřené na hodnocení výše uvedených faktorů.… mnohonásobné spouštění klasifikací pomocí skriptů – vyhodnocení statistické významnosti různě nastavených parametrů trénování/validace na výsledek přesnosti hodnocení přesnosti klasifikace.
Možno zpracovat jen jednu fázi, tzn. hodnotit pouze proces trénování nebo pouze proces validace a též zvolit jen jeden klasifikátor.
 
Univerzita Karlova | Informační systém UK