text size

Automatický expresivní čtený projev

Notice: I hereby declare that I am aware that the information acquired from theses published by Charles University may not be used for commercial purposes or may not be published for educational, scientific or other creative activities as activities of person other than the author.
Title:
Automatický expresivní čtený projev
Titile (in english):
Automatic Expressive Reading
Type:
Bachelor's thesis
Author:
Bc. Jan Výkruta
Supervisor:
Mgr. Jan Hajič
Opponent:
Mgr. Jindřich Libovický
Thesis Id:
208179
Faculty:
Faculty of Mathematics and Physics (MFF)
Department:
Institute of Formal and Applied Linguistics (32-UFAL)
Study programm:
Computer Science (B1801)
Study branch:
General Computer Science (IOI)
Degree granted:
Bc.
Defence date:
05/09/2019
Defence result:
Excellent
Language:
English
Keywords (in czech):
Generativní modelování, prosodie, rozpoznávání řeči
Keywords:
Generative modeling, prosody, speech recognition
Abstract (in czech):
Abstrakt Expresivní čtení je jedním ze způsobů verbálního projevu. Obvykle bývá čte- ným textem próza nebo poezie. Zatím málo prací se zabývalo tím, co ovlivňuje expresivitu a jestli se dá vygenerovat pomocí počítače. LibriSpeech je velkým korpusem čtené prózy a poezie, a umožňuje nám otestovat generování expre- sivního čtení pomocí metod strojového učení. Soustředili jsme se na poezii, neboť obvykle vyžaduje větší expresivitu. Implementovali jsme metody, které mohu být využity k natrénování dalších modelů i k vytvoření nových dat, která mohou být použita v našich metodách na trénování. Dále jsme vytvořili roz- šiřitelnou aplikaci, která dostane báseň, předpoví její expresivní čtení a toto čtení vizualizuje. Navíc ještě přehraje audio nahrávku vygenerovanou pomocí Text-To-Speech systému. 1
Abstract:
Abstract Expressive reading is one of possible oral presentations. The text being read is usually prose or poetry. Little has been done in research of what affects expressiveness and whether it can be generated by computers. LibriSpeech, a large scale corpus of read prose and poetry allows us to test generation of expressive reading using machine learning methods. We have focused on poetry as it is generally more expressive. We have prepared methods, that can be used to train more models as well as to prepare different data that could be fed in our learning methods. Moreover, we have developed an extendable application that takes a poem, predicts the reading, visualizes it and plays an audio record generated from the reading using a TTS system. 1
Documents
Download Document Author Type File size
Download Text of the thesis Bc. Jan Výkruta 2.68 MB
Download Attachment to the thesis Bc. Jan Výkruta 737.15 MB
Download Abstract in czech Bc. Jan Výkruta 52 kB
Download Abstract in english Bc. Jan Výkruta 62 kB
Download Supervisor's review Mgr. Jan Hajič 92 kB
Download Opponent's review Mgr. Jindřich Libovický 72 kB
Download Defence's report doc. Ing. Petr Tůma, Dr. 152 kB