Obohatit pojmenované entity anotované v Pražském závislostním korpusu o automaticky extrahované informace z Wikipedie a dalších zdrojů
Název práce v češtině: | Obohatit pojmenované entity anotované v Pražském závislostním korpusu o automaticky extrahované informace z Wikipedie a dalších zdrojů |
---|---|
Název v anglickém jazyce: | Enrich named entities annotated in the Prague Dependency Treebank with information automatically extracted from Wikipedia and other sources |
Klíčová slova: | pojmenované entity, information retrieval, wikipedie |
Klíčová slova anglicky: | Named Entities, Information Retrieval, Wikipedia, |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | bakalářská práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Pavel Straňák, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Pojmenované entity, které jsou součástí dat Prague Dependency Treebank 2.5 obohatit o automaticky extrahované glosy a zařadit je do slovníku.
- analyzovat, co lze ke kterým entitám získat pomocí reg. výrazů (viz Feng et al.) - provést a vyhodnotit experimenty alespoň pro nejnadějnější typ pojmenovaných entit, např. "jména osob", nebo "lokace" |
Seznam odborné literatury |
D. Feng, D. Ravichandran, and E. H. Hovy. Mining and re-ranking for answering biographical queries on the web. In Proceedings of the conference of the American Association of Artificial Intelligence (AAAI-06), Boston, MA, 2006. |