Thesis (Selection of subject)Thesis (Selection of subject)(version: 393)
Thesis details
   Login via CAS
   
Konfigurovatelné vyhledávání entit
Thesis title in Czech: Konfigurovatelné vyhledávání entit
Thesis title in English: Configurable Entity Extraction
Academic year of topic announcement: 2005/2006
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor: RNDr. Jan Hric
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 21.11.2005
Date of assignment: 21.11.2005
Date and time of defence: 31.01.2008 00:00
Date of electronic submission:31.01.2008
Date of proceeded defence: 31.01.2008
Opponents: RNDr. Michal Kopecký, Ph.D.
 
 
 
Guidelines
Cílem práce je vytvořit systém, který na základě zadaných částí textu
(od slov a frází až po dokumenty) s relevantními entitami určí typické
kontexty pro hledané entity. Následně systém bude schopen podle kontextu
najít entity v dalších textech. Typické hledané entity jsou faktografické údaje
jako jména osob, institucí, měst, výrobků ...
Konfigurovatelnost systému by měla dovolit využívat v kontextu všechny
dostupné informace o textu, tj. nejen sousednost slov, ale i syntaktickou strukturu.
References
Riloff, E. 1993. Automatically constructing a dictionary for information extraction tasks. In Proceedings of the Eleventh National Conference on Artificial Intelligence, 811--816. http://citeseer.ist.psu.edu/riloff93automatically.html

Riloff, E., & Jones, R. (1999). Learning Dictionaries for Information Extraction Using Multilevel Boot-strapping. Proceedings of the Sixteenth National Conference on Artificial Intellligence (AAAI-99) (pp. 1044--1049). The AAAI Press/MIT Press. http://citeseer.ist.psu.edu/riloff99learning.html
Preliminary scope of work
Pokracovanie rocnikoveho projektu - Petr Koval.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html