Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Detekce chyb v rozpoznávání mluvené řeči

Název práce v češtině:	Detekce chyb v rozpoznávání mluvené řeči
Název v anglickém jazyce:	Error detection in speech recognition
Akademický rok vypsání:	2005/2006
Typ práce:	diplomová práce
Jazyk práce:	čeština
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	prof. RNDr. Jan Hajič, Dr.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	07.11.2007
Datum zadání:	21.01.2008
Datum a čas obhajoby:	26.05.2008 00:00
Datum odevzdání elektronické podoby:	26.05.2008
Datum proběhlé obhajoby:	26.05.2008
Oponenti:	Mgr. Nino Peterek, Ph.D.

Zásady pro vypracování

Současné rozpoznávače mluvené řeči stále nefungují bezchybně. V aplikacích jako jsou dialogové systémy se s výhodou dá využít informace o problematických usecích automatického přepisu. Proto je tato problematika stále aktuální.

Výstupem rozpoznávače mluvené řeči je posloupnost slov. Některá slova se rozpoznají špatně - neodpovídají ruční transkripci. Tato slova považujeme za chyby, které má za úkol detektor chyb odhalit. Během trénování detektoru budou k dispozici ruční transkripce, z nichž se může detektor poučit. Testování se provádí tak, že slova navržená detektorem jako chyby se porovnají s ruční transkripcí. Tím se zjistí, v kolika případech detektor odhalil chybu rozpoznávače a v kolika případech správně rozpoznané slovo mylně označil za chybu.

Cílem diplomové práce je seznámit se s danou problematikou, dále pak navrhnout a implementovat detektor chyb. Bude implementováno několik metod, které budou statisticky porovnány.

Vstupem algoritmu je tedy posloupnost slov délky N, výstupem je posloupnost binárních hodnot délky N udávající, zda dané slovo bylo správně, či špatně rozpoznané.

Výsledný systém bude otestován na nahrávkách českého radia a televize (Czech Broadcast News Corpus).

Seznam odborné literatury

Xuedong Huang, Hsiao-Wuen Hon, Raj Reddy
Spoken Language Processing
PRENTICE HALL, 2001

Frederick Jelinek,
Statistical Methods for Speech Recognition
MIT Press 1988

Mehryar Mohri, Fernando C. N. Pereira, and Michael Riley
Weighted Finite-State Transducers in Speech Recognition
Computer Speech and Language, 16(1):69-88, 2002.
(http://www.research.att.com/sw/tools/fsm/ref.html)