Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
On the Possibility of ESP Data Use in Natural Language Processing
Thesis title in Czech: Možnost využití dat ze hry ESP v úlohách počítačového zpracování jazyka
Thesis title in English: On the Possibility of ESP Data Use in Natural Language Processing
Key words: hra ESP, popisky obrázků, texty vs. obrázky
English key words: ESP game, image labels, texts vs. images
Academic year of topic announcement: 2010/2011
Thesis type: Bachelor's thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 07.01.2011
Date of assignment: 17.01.2011
Date and time of defence: 07.09.2011 00:00
Date of electronic submission:05.08.2011
Date of submission of printed version:05.08.2011
Date of proceeded defence: 07.09.2011
Opponents: doc. RNDr. Pavel Pecina, Ph.D.
 
 
 
Guidelines
Výstupem on-line hry ESP game je databáze obrázků a jejich anglických popisků. Autoři hry dali volně k dispozici vzorek dat, který obsahuje 100 tis. dvojic obrázků a jejich popisků. Cílem bakalářské práce je vytipovat úlohy počítačového zpracování přirozeného jazyka, pro které by mohla být tato databáze přínosná. Pozornost bude zaměřena mj. na určování koreference a na přínosnost lexikální databázi WordNet.Kvantifikace míry přínosu je součástí řešení.

V rámci práce bude implementován prohlížeč databáze obrázků a jejich popisků. Experimenty budou probíhat na anotovaných i neanotovaných textech, cílovými jazyky práce jsou angličtina a čeština.
References
Luis von Ahn, Laura Dabbish. Labeling Imager with a Computer Game. ACM Conference on Human Factors in Computing Systems, CHI 2004. s. 319-326.

GWAP portal, http://gwap.com

WordNet, http://wordnet.princeton.edu/.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html