velikost textu

Semi-supervised deep learning in sequence labeling

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Semi-supervised deep learning in sequence labeling
Název v češtině:
Semisupervizované hluboké učení v označování sekvencí
Typ:
Diplomová práce
Autor:
Juraj Eduard Páll
Vedoucí:
Tomáš Šabata
Oponent:
Martin Flusser
Konzultant:
doc. RNDr. Ing. Martin Holeňa, CSc.
Id práce:
212278
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Katedra teoretické informatiky a matematické logiky (32-KTIML)
Program studia:
Informatika (N1801)
Obor studia:
Umělá inteligence (IUI)
Přidělovaný titul:
Mgr.
Datum obhajoby:
16. 9. 2019
Výsledek obhajoby:
Výborně
Jazyk práce:
Angličtina
Klíčová slova:
hluboké učení, semi-supervizované učení, modelovaní sekvencí, označování sekvencí, strojové učení, neuronové sítě
Klíčová slova v angličtině:
deep learning, semi-supervised learning, sequence modeling, sequence labeling, machine learning, neural networks
Abstrakt:
Označování sekvencí ve strojovém učení je typ problému, který zahrnuje při- řazování označení jednotlivým členům sekvence. Pro tento typ problému dosáhlo hluboké učení dobrého výkonu. Jedna z nevýhod tohoto přístupu je jeho zá- vislost na velkém množství označených dat. Semi-supervizované učení zmírňuje tento problém používáním levnějších neoznačených dat spolu s daty označenými. V současnosti je použití semi-supervizovaného hlubokého učení v označování sekvencí limitované. Z tohoto důvodu se tato práce zaměřuje na aplikaci semi- supervizovaného hlubokého učení v označování sekvencí. Práce prozkoumává exis- tující přístupy semi-supervizovaného hlubokého učení a navrhuje vlastní přístupy. Navržené přístupy jsou experimentálně vyhodnocené na úlohách rozpoznávání po- jmenovaných entit a tvaroslovného značkování.
Abstract v angličtině:
Sequence labeling is a type of machine learning problem that involves as- signing a label to each sequence member. Deep learning has shown good per- formance for this problem. However, one disadvantage of this approach is its requirement of having a large amount of labeled data. Semi-supervised learning mitigates this problem by using cheaper unlabeled data together with labeled data. Currently, usage of semi-supervised deep learning for sequence labeling is limited. Therefore, the focus of this thesis is on the application of semi-super- vised deep learning in sequence labeling. Existing semi-supervised deep learning approaches are examined, and approaches for sequence labeling are proposed. The proposed approaches were implemented and experimentally evaluated on named-entity recognition and part-of-speech tagging tasks.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Juraj Eduard Páll 1.76 MB
Stáhnout Příloha k práci Juraj Eduard Páll 12.6 MB
Stáhnout Abstrakt v českém jazyce Juraj Eduard Páll 39 kB
Stáhnout Abstrakt anglicky Juraj Eduard Páll 38 kB
Stáhnout Posudek vedoucího Tomáš Šabata 50 kB
Stáhnout Posudek oponenta Martin Flusser 52 kB
Stáhnout Záznam o průběhu obhajoby doc. RNDr. Iveta Mrázová, CSc. 152 kB