Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Využití syntaxe v metodách pro vyhledávání informací
Název práce v češtině: Využití syntaxe v metodách pro vyhledávání informací
Název v anglickém jazyce: Syntax in methods for information retrieval
Akademický rok vypsání: 2007/2008
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 16.11.2007
Datum zadání: 16.11.2007
Datum a čas obhajoby: 11.05.2009 00:00
Datum odevzdání elektronické podoby:29.04.2009
Datum odevzdání tištěné podoby:29.04.2009
Datum proběhlé obhajoby: 11.05.2009
Oponenti: RNDr. Martin Holub, Ph.D.
 
 
 
Zásady pro vypracování
Pravděpodobnostním metodám založeným na jazykovém modelování je v posledních letech výzkumu v oblasti vyhledávání informací věnována značná pozornost. I přesto, že tento přístup dovoluje použití libovolného jazykového modelu, většina experimentů, jejichž výsledky byly doposud publikovány, byla prováděna s klasickým n-gramovým jazykovým modelem založeným na povrchovém slovosledu. Myšlenka použití jazykového modelu využívajícího syntax není v této oblasti zcela nová, ale doposud nebyl prokázán její významnější přínos. Jedním z důvodů může být fakt, že doposud publikované práce vyhodnocovaly tento přístup na kolekci dokumentů v angličtině, která má poměrně pevný slovosled a přínos využití syntaxe zde nemusí být tak významný. Dalším důvodem může být poměrně nízká úspěšnost použitých syntaktických parserů. Cílem diplomové práce je navrhnout, implementovat a vyhodnotit (na českých datech) metodu, která by pravděpodobnostní model pro vyhledávání informací obohatila o využití syntaktické informace získané automaticky (strojově) z dokumentů i dotazů.
Seznam odborné literatury
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley. 1999

Jay M. Ponte and W. Bruce Croft. A language modeling approach to information retrieval.
In Proceedings of the 21st annual international ACM SIGIR conference, pages 275-281, 1998.

Ramesh Nallapati and James Allan. Capturing term dependencies using a language model
based on sentence trees. In CIKM ?02: Proceedings of the eleventh international conference
on Information and knowledge management, pages 383-390, 2002.

Jianfeng Gao, Jian-Yun Nie, Guangyuan Wu, and Guihong Cao. Dependence language model
for information retrieval. In Proceedings of the 27th annual international ACM SIGIR con-
ference on Research and development in information retrieval, pages 170-177, 2004.

Changki Lee, Gary Geunbae Lee, and Myung Gil Jang. Dependency structure applied to
language modeling for information retrieval. ETRI Journal, 28:337-346, 2006.
 
Univerzita Karlova | Informační systém UK