Detekce chyb v rozpoznávání mluvené řeči
Název práce v češtině: | Detekce chyb v rozpoznávání mluvené řeči |
---|---|
Název v anglickém jazyce: | Error detection in speech recognition |
Akademický rok vypsání: | 2005/2006 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | prof. RNDr. Jan Hajič, Dr. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 07.11.2007 |
Datum zadání: | 21.01.2008 |
Datum a čas obhajoby: | 26.05.2008 00:00 |
Datum odevzdání elektronické podoby: | 26.05.2008 |
Datum proběhlé obhajoby: | 26.05.2008 |
Oponenti: | Mgr. Nino Peterek, Ph.D. |
Zásady pro vypracování |
Současné rozpoznávače mluvené řeči stále nefungují bezchybně. V aplikacích jako jsou dialogové systémy se s výhodou dá využít informace o problematických usecích automatického přepisu. Proto je tato problematika stále aktuální.
Výstupem rozpoznávače mluvené řeči je posloupnost slov. Některá slova se rozpoznají špatně - neodpovídají ruční transkripci. Tato slova považujeme za chyby, které má za úkol detektor chyb odhalit. Během trénování detektoru budou k dispozici ruční transkripce, z nichž se může detektor poučit. Testování se provádí tak, že slova navržená detektorem jako chyby se porovnají s ruční transkripcí. Tím se zjistí, v kolika případech detektor odhalil chybu rozpoznávače a v kolika případech správně rozpoznané slovo mylně označil za chybu. Cílem diplomové práce je seznámit se s danou problematikou, dále pak navrhnout a implementovat detektor chyb. Bude implementováno několik metod, které budou statisticky porovnány. Vstupem algoritmu je tedy posloupnost slov délky N, výstupem je posloupnost binárních hodnot délky N udávající, zda dané slovo bylo správně, či špatně rozpoznané. Výsledný systém bude otestován na nahrávkách českého radia a televize (Czech Broadcast News Corpus). |
Seznam odborné literatury |
Xuedong Huang, Hsiao-Wuen Hon, Raj Reddy
Spoken Language Processing PRENTICE HALL, 2001 Frederick Jelinek, Statistical Methods for Speech Recognition MIT Press 1988 Mehryar Mohri, Fernando C. N. Pereira, and Michael Riley Weighted Finite-State Transducers in Speech Recognition Computer Speech and Language, 16(1):69-88, 2002. (http://www.research.att.com/sw/tools/fsm/ref.html) |