velikost textu

Optimalizace tvorby trénovacího a validačního datasetu pro zvýšení přesnosti klasifikace v dálkovém průzkumu Země

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Optimalizace tvorby trénovacího a validačního datasetu pro zvýšení přesnosti klasifikace v dálkovém průzkumu Země
Název v angličtině:
Training and validation dataset optimization for Earth observation classification accuracy improvement
Typ:
Diplomová práce
Autor:
Bc. Barbora Chytilová
Vedoucí:
RNDr. Lucie Kupková, Ph.D.
Oponent:
Ing. Markéta Potůčková, Ph.D.
Konzultant:
RNDr. Jakub Lysák
Id práce:
186583
Fakulta:
Přírodovědecká fakulta (PřF)
Pracoviště:
Katedra aplikované geoinformatiky a kartografie (31-370)
Program studia:
Geografie (N1301)
Obor studia:
Kartografie a geoinformatika (NKARTGD)
Přidělovaný titul:
Mgr.
Datum obhajoby:
9. 9. 2019
Výsledek obhajoby:
Velmi dobře
Jazyk práce:
Čeština
Klíčová slova:
trénovací dataset, validační dataset, hodnocení přesnosti klasifikace. Maximum Likelihood, Support Vector Machine
Klíčová slova v angličtině:
training dataset, validation dataset, classification accuracy improvement, Maximum Likelihood, Support Vector Machine
Abstrakt:
Abstrakt Diplomová práce se zabývá optimalizací trénovacího a validačního datasetu pro řízenou klasifikaci dat v DPZ. V rámci řešení práce jsou v území lesně-luční krajiny v Podkrkonoší prováděny pro dva klasifikační algoritmy (Maximum Likelihood – MLC a Support Vector Machine – SVM) experimenty s trénovacími a validačními daty. Práce vychází z předpokladu, že pro dosažení maximální přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat (Foody, 2009). Další hypotézou práce byl předpoklad, že v případě klasifikace pomocí algoritmu SVM je pro dosažení stejné/podobné přesnosti klasifikace potřeba nižší počet trénovacích bodů než v případě klasifikačního algoritmu Maximum Likelihood (Foody, 2004). Cílem práce bylo testovat vliv podílu/množství trénovacích a validačních dat na přesnost klasifikace multispektrálních dat senzoru Sentinel-2A s využitím algoritmu Maximum Likelihood. Nejvyšší celkové přesnosti při využití klasifikačního algoritmu Maximum Likelihood bylo dosaženo pro podíl 375 trénovacích a 625 validačních bodů. Celková přesnost pro tento podíl byla 72,88 %. Teorie Foodyho (2009), že pro dosažení nejvyšší přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat potvrzují výsledky hodnocení celkové přesnosti a Kappa koeficientu pro Maximum Likelihood. Avšak výsledné uživatelské a zpracovatelské přesnosti pro jednotlivé třídy nedosáhly v případě tohoto podílu nejvyšších hodnot. Také se ukázalo, že změna velikosti validačního datasetu při zachování stabilní velikosti trénovacího datasetu má vliv na stabilitu výsledku hodnocení přesnosti klasifikace metodou Maximum Likelihood. Výsledek hodnocení celkové přesnosti pro algoritmus SVM pro tento podíl 375 trénovacích a 625 validačních bodů byl 79,09 %. V případě, že se počet trénovacích bodů snížil na 50 byla celková přesnost klasifikace 76,49 %. Předpoklad, že pomocí algoritmu SVM je pro dosažení stejné/podobné přesnosti klasifikace potřeba nižší počet trénovacích bodů než v případě klasifikačního algoritmu Maximum Likelihood, byl pro tento dataset potvrzen. Klíčová slova: trénovací dataset, validační dataset, hodnocení přesnosti klasifikace, Maximum Likelihood, Support Vector Machine
Abstract v angličtině:
Abstract This thesis deals with training dataset and validation dataset for Earth observation classification accuracy improvement. Experiments with training data and validation data for two classification algorithms (Maximum Likelihood – MLC and Support Vector Machine – SVM) are carried out from the forest-meadow landscape located in the foothill of the Giant Mountains (Podkrkonoší). The thesis is base on the assumption that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve maximal classification accuracy (Foody, 2009). Another hypothesis was that in a case of SVM classification, a lower number of training point is required to achieve the same or similar accuracy of classification, as in the case of the MLC algorithm (Foody, 2004). The main goal of the thesis was to test the influence of proportion / amount of training and validation data on the classification accuracy of Sentinel – 2A multispectral data using the MLC algorithm. The highest overal accuracy using the MLC classification algorithm was achieved for 375 training and 625 validation points. The overal accuracy for this ratio was 72,88 %. The theory of Foody (2009) that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve the highest classification accuracy, was confirmed by the overal accuracy and Kappa coefficient results for MLC. It should be noted, that resulting Producer´s and User´s Accuracies for particular classes did not reach the highest values for this ratio. While size of the training dataset is sustained, further test showed that the change in the size of the validation dataset has an effect on the stability of MLC classsification accuracy assesment result. Result of overall accuracy evaluationin the case of SVM algorithm for the ratio 375 training points and 625 validation points was 79,09 %. In the case of 50 validation points the overal accuracy had reached 76,49 %. The assumption, that SVM algorithm needs lower number of training points to achieve similar classification accuracy as MLC algorithm was confirmed for this dataset. Keywords: training dataset, validation dataset, classification accuracy improvement, Maximum Likelihood, Support Vector Machine
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Bc. Barbora Chytilová 2.93 MB
Stáhnout Příloha k práci Bc. Barbora Chytilová 297 kB
Stáhnout Abstrakt v českém jazyce Bc. Barbora Chytilová 114 kB
Stáhnout Abstrakt anglicky Bc. Barbora Chytilová 114 kB
Stáhnout Posudek vedoucího RNDr. Lucie Kupková, Ph.D. 113 kB
Stáhnout Posudek oponenta Ing. Markéta Potůčková, Ph.D. 118 kB
Stáhnout Záznam o průběhu obhajoby RNDr. Přemysl Štych, Ph.D. 152 kB