Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči.
Název práce v jazyce práce (slovenština): | Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči. |
---|---|
Název práce v češtině: | Evaluační metody systémů pro vyhledávání v nesegmentované mluvené řeči. |
Název v anglickém jazyce: | Evaluation methods of systems for unsegmented speech retrieval. |
Klíčová slova: | hovorená reč, získavanie informácií v hovorenej reči, vyhodnocovanie |
Klíčová slova anglicky: | speech, speech retrieval, evaluation |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | diplomová práce |
Jazyk práce: | slovenština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 25.03.2009 |
Datum zadání: | 25.03.2011 |
Datum a čas obhajoby: | 10.05.2011 00:00 |
Datum odevzdání elektronické podoby: | 15.04.2011 |
Datum odevzdání tištěné podoby: | 15.04.2011 |
Datum proběhlé obhajoby: | 10.05.2011 |
Oponenti: | PhDr. Petra Hoffmannová |
Zásady pro vypracování |
Úkolem systémů pro vyhledávání v nesegmentované mluvené řeči je automatická identifikace tématicky koherentních pasáží v záznamech mluvené řeči. Vstupem je specifikace tématu (dotaz), výstupem časově určené začátky a konce relevantních pasáží. Oproti klasickému vyhledávání v kolekcích dokumentů (diskrétně rozlišených) se v tomto prípadě jedná o vyhledávání na spojitém prostoru (časové ose nahrávek); řeč není předem segmentována na kratší úseky ("dokumenty"), o jejichž relevanci k tématu je třeba rozhodnout, ale součástí řešení úlohy je tyto úseky objevit (mohou začínat, resp. končit v jakémkoliv okamžiku nahrávky).
Cílem zadané práce je seznámit se s různými přístupy pro vyhodnocování úspěšnosti systémů pro vyhledávání v nesegmentované mluvené řeči, navrhnout některé vlastní a posoudit vhodnost jejich použití na kolekci záznamů výpovědí svědků holokaustu připravené v rámci projektu Malach. |
Seznam odborné literatury |
Liu, B., Oard, D.W.: One-sided measures for evaluating ranked retrieval effectiveness with spontaneous conversational speech. In: Proceedings of the 29th Annual
International ACM SIGIR Conference on Research and Development in Information Retrieval. (2006) Douglas Oard, Jianqiang Wang, Gareth Jones, Ryen White, Pavel Pecina, Dagobert Soergel, Xiaoli Huang, and Izhak Shafran: Overview of the CLEF-2006 Cross-Language Speech Retrieval Track. in Carol Peters et al. (Eds.): Evaluation of Multilingual and Multi-modal Information Retrieval (CLEF 2006), Revised Selected Papers. Lecture Notes in Computer Science, Springer 2007 |