Využití syntaxe v metodách pro vyhledávání informací
Název práce v češtině: | Využití syntaxe v metodách pro vyhledávání informací |
---|---|
Název v anglickém jazyce: | Syntax in methods for information retrieval |
Akademický rok vypsání: | 2007/2008 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 16.11.2007 |
Datum zadání: | 16.11.2007 |
Datum a čas obhajoby: | 11.05.2009 00:00 |
Datum odevzdání elektronické podoby: | 29.04.2009 |
Datum odevzdání tištěné podoby: | 29.04.2009 |
Datum proběhlé obhajoby: | 11.05.2009 |
Oponenti: | RNDr. Martin Holub, Ph.D. |
Zásady pro vypracování |
Pravděpodobnostním metodám založeným na jazykovém modelování je v posledních letech výzkumu v oblasti vyhledávání informací věnována značná pozornost. I přesto, že tento přístup dovoluje použití libovolného jazykového modelu, většina experimentů, jejichž výsledky byly doposud publikovány, byla prováděna s klasickým n-gramovým jazykovým modelem založeným na povrchovém slovosledu. Myšlenka použití jazykového modelu využívajícího syntax není v této oblasti zcela nová, ale doposud nebyl prokázán její významnější přínos. Jedním z důvodů může být fakt, že doposud publikované práce vyhodnocovaly tento přístup na kolekci dokumentů v angličtině, která má poměrně pevný slovosled a přínos využití syntaxe zde nemusí být tak významný. Dalším důvodem může být poměrně nízká úspěšnost použitých syntaktických parserů. Cílem diplomové práce je navrhnout, implementovat a vyhodnotit (na českých datech) metodu, která by pravděpodobnostní model pro vyhledávání informací obohatila o využití syntaktické informace získané automaticky (strojově) z dokumentů i dotazů.
|
Seznam odborné literatury |
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley. 1999
Jay M. Ponte and W. Bruce Croft. A language modeling approach to information retrieval. In Proceedings of the 21st annual international ACM SIGIR conference, pages 275-281, 1998. Ramesh Nallapati and James Allan. Capturing term dependencies using a language model based on sentence trees. In CIKM ?02: Proceedings of the eleventh international conference on Information and knowledge management, pages 383-390, 2002. Jianfeng Gao, Jian-Yun Nie, Guangyuan Wu, and Guihong Cao. Dependence language model for information retrieval. In Proceedings of the 27th annual international ACM SIGIR con- ference on Research and development in information retrieval, pages 170-177, 2004. Changki Lee, Gary Geunbae Lee, and Myung Gil Jang. Dependency structure applied to language modeling for information retrieval. ETRI Journal, 28:337-346, 2006. |