velikost textu

Hybrid Deep Question Answering

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Hybrid Deep Question Answering
Název v češtině:
Hybridní hluboké metody pro automatické odpovídání na otázky
Typ:
Disertační práce
Autor:
Ahmad Aghaebrahimian, Ph.D.
Školitel:
RNDr. Martin Holub, Ph.D.
Oponenti:
Ing. Pavel Kordik, Ph.D.
RNDr. Pavel Pecina, Ph.D.
Id práce:
150637
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav formální a aplikované lingvistiky (32-UFAL)
Program studia:
Informatika (P1801)
Obor studia:
Matematická lingvistika (4I3)
Přidělovaný titul:
Ph.D.
Datum obhajoby:
5. 2. 2019
Výsledek obhajoby:
Prospěl/a
Jazyk práce:
Angličtina
Klíčová slova:
Odpovídání na otázky, odpovídání na otázky na úrovni slov, odpovídání na otázky na úrovni vět, neuronová síť, znalostní graf, konvoluční neuronová síť, rekurentní neuronová síť, vztah konstituentů
Klíčová slova v angličtině:
Question Answering, Word-level Question Answering, Sentence-level Question Answering, Neural Network, Knowledge Graph, Convolution Neural Network, Recurrent Neural Network, Constituency Relation
Abstrakt:
Název práce: Hybridní hluboké metody pro automatické odpovídání na otázky Autor: Ahmad Aghaebrahimian Ústav: Ústav Formální a Aplikované Lingvistiky Vedoucí disertační práce: RNDr. Martin Holub, Ph.D., Ústav Formální a Ap- likované Lingvistiky Abstrakt: Automatické odpovídání na otázky jakožto jedna z nejstarších úloh z oblasti zpracování přirozeného jazyka je jednou z nejzajímavějších a nejná- ročnějších oblastí výzkumu s množstvím vědeckých a komerčních uplatnění. Od- povídání na otázky jakožto disciplína se ve spojení s informatikou, statistikou, lingvistikou a kognitivní vědou zabývá tvorbou systémů, které automaticky vy- hledávají odpovědi na otázky kladené lidmi v přirozeném jazyce. Tato doktorská disertační práce představuje autorův výzkum uskutečněný v uvedené oblasti. Au- tor předkládá především své studie a výzkum zaměřený na hybridní systémy pro odpovídání na otázky zahrnující vyhledávací stroje pracující jak se struktu- rovanými, tak s nestrukturovanými daty. Jádrem strukturovaného vyhledávacího stroje je state-of-the-art systém založený na znalostních grafech. Nestrukturovaný vyhledávací stroj je tvořen state-of-the-art systémem pro odpovídání na otázky na větné úrovni a systémem pro odpovídání na otázky na úrovni slov s výsledky, které se blíží tomu, čeho dosahují lidé. Tato práce představuje také nově vy- vinutý standardní soubor “zlatých” dat pro odpovídání na otázky jak na větné úrovni, tak na úrovni slov. Počínaje jednoduchým modelem logistické regrese, autor postupně prezentuje pokročilejší modely včetně řešení pomocí vícevrstvé neuronové sítě, konvoluční neuronové sítě a rekurentní neuronové sítě pro různé výše uvedené systémy pro odpovídání na otázky. Přestože jádrem všech modulů vyvinutých v této práci jsou nově navržené struktury hlubokých neuronových sítí, je do nich také zaintegrováno několik principů založených na jazykové intuici jako např. teorie frázové struktury a vztahy konstituentů, a to za účelem zlepšení jejich výkonnosti. Klíčová slova: Odpovídání na otázky, odpovídání na otázky na úrovni slov, od- povídání na otázky na úrovni vět, neuronová síť, znalostní graf, konvoluční neu- ronová síť, rekurentní neuronová síť, vztah konstituentů iv
Abstract v angličtině:
Title: Hybrid Deep Question Answering Author: Ahmad Aghaebrahimian Institute: Institute of Formal and Applied Linguistics Supervisor: RNDr. Martin Holub, Ph.D., Institute of Formal and Applied Lin- guistics Abstract: As one of the oldest tasks of Natural Language Processing, Question Answering is one of the most exciting and challenging research areas with lots of scientific and commercial applications. Question Answering as a discipline in the conjunction of computer science, statistics, linguistics, and cognitive science is concerned with building systems that automatically retrieve answers to ques- tions posed by humans in a natural language. This doctoral dissertation presents the author’s research carried out in this discipline. It highlights his studies and research toward a hybrid Question Answering system consisting of two engines for Question Answering over structured and unstructured data. The structured engine comprises a state-of-the-art Question Answering system based on knowl- edge graphs. The unstructured engine consists of a state-of-the-art sentence-level Question Answering system and a word-level Question Answering system with results near to human performance. This work introduces a new Question An- swering dataset for answering word- and sentence-level questions as well. Start- ing from a simple Logistic Regression model, the author presents more advanced models including multi-layer Neural Network, Convolution Neural Network and Recurrent Neural Network solutions for different Question Answering systems mentioned above. Although the core of all developed modules in this work are new Deep Neural Network architectures, several linguistic intuitions such as phrase structure theory and constituency relations are integrated into them to improve their performance. Keywords: Question Answering, Word-level Question Answering, Sentence-level Question Answering, Neural Network, Knowledge Graph, Convolution Neural Network, Recurrent Neural Network, Constituency Relation iii
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Ahmad Aghaebrahimian, Ph.D. 7.08 MB
Stáhnout Abstrakt v českém jazyce Ahmad Aghaebrahimian, Ph.D. 23 kB
Stáhnout Abstrakt anglicky Ahmad Aghaebrahimian, Ph.D. 21 kB
Stáhnout Posudek vedoucího RNDr. Martin Holub, Ph.D. 746 kB
Stáhnout Posudek oponenta Ing. Pavel Kordik, Ph.D. 105 kB
Stáhnout Posudek oponenta RNDr. Pavel Pecina, Ph.D. 60 kB
Stáhnout Záznam o průběhu obhajoby 77 kB