On the Possibility of ESP Data Use in Natural Language Processing
Název práce v češtině: | Možnost využití dat ze hry ESP v úlohách počítačového zpracování jazyka |
---|---|
Název v anglickém jazyce: | On the Possibility of ESP Data Use in Natural Language Processing |
Klíčová slova: | hra ESP, popisky obrázků, texty vs. obrázky |
Klíčová slova anglicky: | ESP game, image labels, texts vs. images |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 07.01.2011 |
Datum zadání: | 17.01.2011 |
Datum a čas obhajoby: | 07.09.2011 00:00 |
Datum odevzdání elektronické podoby: | 05.08.2011 |
Datum odevzdání tištěné podoby: | 05.08.2011 |
Datum proběhlé obhajoby: | 07.09.2011 |
Oponenti: | doc. RNDr. Pavel Pecina, Ph.D. |
Zásady pro vypracování |
Výstupem on-line hry ESP game je databáze obrázků a jejich anglických popisků. Autoři hry dali volně k dispozici vzorek dat, který obsahuje 100 tis. dvojic obrázků a jejich popisků. Cílem bakalářské práce je vytipovat úlohy počítačového zpracování přirozeného jazyka, pro které by mohla být tato databáze přínosná. Pozornost bude zaměřena mj. na určování koreference a na přínosnost lexikální databázi WordNet.Kvantifikace míry přínosu je součástí řešení.
V rámci práce bude implementován prohlížeč databáze obrázků a jejich popisků. Experimenty budou probíhat na anotovaných i neanotovaných textech, cílovými jazyky práce jsou angličtina a čeština. |
Seznam odborné literatury |
Luis von Ahn, Laura Dabbish. Labeling Imager with a Computer Game. ACM Conference on Human Factors in Computing Systems, CHI 2004. s. 319-326.
GWAP portal, http://gwap.com WordNet, http://wordnet.princeton.edu/. |