velikost textu

Hledání odpovědi v odpovědích

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Hledání odpovědi v odpovědích
Název v angličtině:
Finding the answer in the answers
Typ:
Bakalářská práce
Autor:
Bc. Jakub Záhumenský
Vedoucí:
Mgr. Barbora Vidová Hladká, Ph.D.
Oponent:
RNDr. Ondřej Bojar, Ph.D.
Id práce:
79459
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav formální a aplikované lingvistiky (32-UFAL)
Program studia:
Informatika (B1801)
Obor studia:
Obecná informatika (IOI)
Přidělovaný titul:
Bc.
Datum obhajoby:
20. 6. 2011
Výsledek obhajoby:
Výborně
Jazyk práce:
Slovenština
Klíčová slova:
dialógový systém, tf x idf váhy, frekvenčná analýza, morfologická analýza, syntaktická analýza, tool_chain, Václav Havel, korpus
Klíčová slova v angličtině:
dialogue system, tf x idf weights, frequency analysis, morphological analysis, syntactical analysis, tool_chain, Václav Havel, corpus
Abstrakt:
Názov práce : Hľadanie odpovedí v odpovediach Autor : Jakub Záhumenský Kontakt : zahumensky.jakub@gmail.com Katedra : Ústav formalní a aplikované lingvistiky Vedúca práce : Mgr. Barbora Vidová Hladká, Ph.D. Kontakt : hladka@ufal.mff.cuni.cz Abstrakt : Témou tejto práce je navrhnúť a implementovať dialógový systém, ktorý bude simulovať rozhovor uživateľa s reálnou osobnosťou. Využívať budeme korpus reálnych rozhovorov zozbieraných z webových stránok. V implementácii budeme používať prístup vyhľadávania najpodobnejšej otázky v korpuse s otázkou uživateľa. Odpoveďou na uživateľovu otázku bude následne odpoveď na nájdenú najpodobnejšiu otázku z korpusu. V práci budeme využívať morfologickú a syntaktickú rovinu jazyka, rovnako ako frekvenčnú analýzu pomocou tf-idf váh, na určenie najpodobnejšej otázky. Otázky budú zozbierané v korpuse, ktorého vytvorenie je súčasťou tejto práce. Konkrétne v tejto práci budeme zbierať rozhovory s významnou českou osobnosťou, Václavom Havlom. Aplikácia bude pracovať s textami v českom jazyku.
Abstract v angličtině:
Title : Searching for the answer in answers Author : Jakub Záhumenský Contact : zahumensky.jakub@gmail.com Department : Institute of Formal and Applied Linguistics Supervisor : Mgr. Barbora Vidová Hladká, Ph.D. Contact on supervisor : hladka@ufal.mff.cuni.cz Abstract : We design a question-answering system Interviewer that enables users to fictionally (virtually) interview this person by asking questions as similar as possible to questions that journalists have already asked. The interviews with a given person posted on the web are being collected as a corpus of (question, answer) pairs. The user asks his/her question and the Interviewer system searches questions in the corpus to provide the answer that belongs to the most similar question. Matching questions is based on the frequency analysis and on the applications coming from natural language processing, namely tagging and parsing. We work with the interviews with Vaclav Havel posted on his personal page.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Bc. Jakub Záhumenský 1.14 MB
Stáhnout Příloha k práci Bc. Jakub Záhumenský 2.46 MB
Stáhnout Abstrakt v českém jazyce Bc. Jakub Záhumenský 22 kB
Stáhnout Abstrakt anglicky Bc. Jakub Záhumenský 22 kB
Stáhnout Posudek vedoucího Mgr. Barbora Vidová Hladká, Ph.D. 158 kB
Stáhnout Posudek oponenta RNDr. Ondřej Bojar, Ph.D. 252 kB
Stáhnout Záznam o průběhu obhajoby doc. Ing. Petr Tůma, Dr. 36 kB