Rozšiřte invertizační krok o podporu lemmat. Navrhněte efektivní strukturu pro ukládání indexu s podporou pro vyhledávání struktur lemmat v dokumentech. Zjistěte zvýšené nároky na I/O operace, resp. čas, při řešení různých typů dotazů, např. konj., disj., fráze ad. Nedílnou součástí práce je i implementace v rámci vyhledávacího stroje EGOTHOR.
Seznam odborné literatury
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003.
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
EGOTHOR: http://www.egothor.org/
Předběžná náplň práce
Q&A systémy často vyžadují podporu pro vyhledávání struktur lemmat. Cílem této práce je navrhnout efektivní datovou strukturu, která tyto požadavky dokáže naplnit.
Předběžná náplň práce v anglickém jazyce
Question Answering systems often require a special data structure which can search for lemmas (and their structure in a text). This work offers a proposal of such a data structure.