Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči.
Název práce v jazyce práce (slovenština): Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči.
Název práce v češtině: Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči.
Název v anglickém jazyce: Evaluation methods of systems for unsegmented speech retrieval.
Klíčová slova: hovorená reč, získavanie informácií v hovorenej reči, vyhodnocovanie
Klíčová slova anglicky: speech, speech retrieval, evaluation
Akademický rok vypsání: 2010/2011
Typ práce: diplomová práce
Jazyk práce: slovenština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 25.03.2009
Datum zadání: 25.03.2011
Datum a čas obhajoby: 10.05.2011 00:00
Datum odevzdání elektronické podoby:15.04.2011
Datum odevzdání tištěné podoby:15.04.2011
Datum proběhlé obhajoby: 10.05.2011
Oponenti: PhDr. Petra Hoffmannová
 
 
 
Zásady pro vypracování
Úkolem systémů pro vyhledávání v nesegmentované mluvené řeči je automatická identifikace tématicky koherentních pasáží v záznamech mluvené řeči. Vstupem je specifikace tématu (dotaz), výstupem časově určené začátky a konce relevantních pasáží. Oproti klasickému vyhledávání v kolekcích dokumentů (diskrétně rozlišených) se v tomto prípadě jedná o vyhledávání na spojitém prostoru (časové ose nahrávek); řeč není předem segmentována na kratší úseky ("dokumenty"), o jejichž relevanci k tématu je třeba rozhodnout, ale součástí řešení úlohy je tyto úseky objevit (mohou začínat, resp. končit v jakémkoliv okamžiku nahrávky).

Cílem zadané práce je seznámit se s různými přístupy pro vyhodnocování úspěšnosti systémů pro vyhledávání v nesegmentované mluvené řeči, navrhnout některé vlastní a posoudit vhodnost jejich použití na kolekci záznamů výpovědí svědků holokaustu připravené v rámci projektu Malach.
Seznam odborné literatury
Liu, B., Oard, D.W.: One-sided measures for evaluating ranked retrieval effectiveness with spontaneous conversational speech. In: Proceedings of the 29th Annual
International ACM SIGIR Conference on Research and Development in Information Retrieval. (2006)

Douglas Oard, Jianqiang Wang, Gareth Jones, Ryen White, Pavel Pecina, Dagobert Soergel, Xiaoli Huang, and Izhak Shafran: Overview of the CLEF-2006 Cross-Language Speech Retrieval Track. in Carol Peters et al. (Eds.): Evaluation of Multilingual and Multi-modal Information Retrieval (CLEF 2006), Revised Selected Papers. Lecture Notes in Computer Science, Springer 2007

 
Univerzita Karlova | Informační systém UK