velikost textu

On the Possibility of ESP Data Use in Natural Language Processing

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
On the Possibility of ESP Data Use in Natural Language Processing
Název v češtině:
Možnost využití dat ze hry ESP v úlohách počítačového zpracování jazyka
Typ:
Bakalářská práce
Autor:
Bc. Tomáš Knopp
Vedoucí:
Mgr. Barbora Vidová Hladká, Ph.D.
Oponent:
RNDr. Pavel Pecina, Ph.D.
Id práce:
96588
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav formální a aplikované lingvistiky (32-UFAL)
Program studia:
Informatika (B1801)
Obor studia:
Obecná informatika (IOI)
Přidělovaný titul:
Bc.
Datum obhajoby:
7. 9. 2011
Výsledek obhajoby:
Velmi dobře
Jazyk práce:
Angličtina
Klíčová slova:
hra ESP, popisky obrázků, texty vs. obrázky
Klíčová slova v angličtině:
ESP game, image labels, texts vs. images
Abstrakt:
Cílem této bakalářské práce je prozkoumat databázi popisků obrázků ze hry ESP z pohledu zpracování přirozeného jazyka. ESP hra je online hra, ve které lidští hráči konají užitečnou práci - obrázky popisují. Výstupem hry ESP je pak databáze obrázků a jejich popisků. Zajímá nás, zda by data nashromážděná v průběhu získávání popisků obrázků mohla být užitečná pro úkoly zpracování přirozeného jazyka. Konkrétně máme na mysli úkol automatického určování koreferencí, rozšíření lexikální databáze WordNet, zjišťování idiomů a zjišťování slovních spojení. V této bakalářské práci se zaměříme na první dva z nich, tedy na použití databáze pro automatické určování koreferencí a na prozkoumání jejího potenciálního přínosu lexikální databázi WordNet.
Abstract v angličtině:
The aim of this bachelor thesis is to explore this image label database coming from the ESP game from the natural language processing (NLP) point of view. ESP game is an online game, in which human players do useful work - they label images. The output of the ESP game is then a database of images and their labels. What interests us is whether the data collected in the process of labeling images will be of any use in NLP tasks. Specifically, we are interested in the tasks of automatic coreference resolution, extension of the lexical database WordNet, idiom detection, and collocation detection. In this bachelor thesis we deal with the first two of them, which is the task of the automatic coreference resolution and the task of exploring the potential benefits to the lexical database WordNet.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Bc. Tomáš Knopp 1.73 MB
Stáhnout Abstrakt v českém jazyce Bc. Tomáš Knopp 42 kB
Stáhnout Abstrakt anglicky Bc. Tomáš Knopp 42 kB
Stáhnout Posudek vedoucího Mgr. Barbora Vidová Hladká, Ph.D. 110 kB
Stáhnout Posudek oponenta RNDr. Pavel Pecina, Ph.D. 64 kB
Stáhnout Záznam o průběhu obhajoby doc. Ing. Petr Tůma, Dr. 81 kB