Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 384)
Detail práce
   Přihlásit přes CAS
On the Possibility of ESP Data Use in Natural Language Processing
Název práce v češtině: Možnost využití dat ze hry ESP v úlohách počítačového zpracování jazyka
Název v anglickém jazyce: On the Possibility of ESP Data Use in Natural Language Processing
Klíčová slova: hra ESP, popisky obrázků, texty vs. obrázky
Klíčová slova anglicky: ESP game, image labels, texts vs. images
Akademický rok vypsání: 2010/2011
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.01.2011
Datum zadání: 17.01.2011
Datum a čas obhajoby: 07.09.2011 00:00
Datum odevzdání elektronické podoby:05.08.2011
Datum odevzdání tištěné podoby:05.08.2011
Datum proběhlé obhajoby: 07.09.2011
Oponenti: doc. RNDr. Pavel Pecina, Ph.D.
 
 
 
Zásady pro vypracování
Výstupem on-line hry ESP game je databáze obrázků a jejich anglických popisků. Autoři hry dali volně k dispozici vzorek dat, který obsahuje 100 tis. dvojic obrázků a jejich popisků. Cílem bakalářské práce je vytipovat úlohy počítačového zpracování přirozeného jazyka, pro které by mohla být tato databáze přínosná. Pozornost bude zaměřena mj. na určování koreference a na přínosnost lexikální databázi WordNet.Kvantifikace míry přínosu je součástí řešení.

V rámci práce bude implementován prohlížeč databáze obrázků a jejich popisků. Experimenty budou probíhat na anotovaných i neanotovaných textech, cílovými jazyky práce jsou angličtina a čeština.
Seznam odborné literatury
Luis von Ahn, Laura Dabbish. Labeling Imager with a Computer Game. ACM Conference on Human Factors in Computing Systems, CHI 2004. s. 319-326.

GWAP portal, http://gwap.com

WordNet, http://wordnet.princeton.edu/.
 
Univerzita Karlova | Informační systém UK