Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Obohatit pojmenované entity anotované v Pražském závislostním korpusu o automaticky extrahované informace z Wikipedie a dalších zdrojů
Název práce v češtině: Obohatit pojmenované entity anotované v Pražském závislostním korpusu
o automaticky extrahované informace z Wikipedie a dalších zdrojů
Název v anglickém jazyce: Enrich named entities annotated in the Prague Dependency Treebank
with information automatically extracted from Wikipedia and other sources
Klíčová slova: pojmenované entity, information retrieval, wikipedie
Klíčová slova anglicky: Named Entities, Information Retrieval, Wikipedia,
Akademický rok vypsání: 2015/2016
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Pavel Straňák, Ph.D.
Řešitel:
Zásady pro vypracování
Pojmenované entity, které jsou součástí dat Prague Dependency Treebank 2.5 obohatit o automaticky extrahované glosy a zařadit je do slovníku.

- analyzovat, co lze ke kterým entitám získat pomocí reg. výrazů (viz Feng et al.)
- provést a vyhodnotit experimenty alespoň pro nejnadějnější typ pojmenovaných entit, např. "jména osob", nebo "lokace"
Seznam odborné literatury
D. Feng, D. Ravichandran, and E. H. Hovy. Mining and re-ranking for answering biographical queries on the web. In Proceedings of the conference of the American Association of Artificial Intelligence (AAAI-06), Boston, MA, 2006.
 
Univerzita Karlova | Informační systém UK