Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Normalization of numbers into spoken form for text-to-speech systems

Thesis title in Czech:	Normalizace čísel pro výslovnost syntézou řeči
Thesis title in English:	Normalization of numbers into spoken form for text-to-speech systems
Key words:	normalizace českého textu\|normalizace čísel\|systém pro syntézu řeči\|vážený konečný převodník
English key words:	Czech text normalization\|number normalization\|text-to-speech systems\|weighted finite-state transducer
Academic year of topic announcement:	2022/2023
Thesis type:	Bachelor's thesis
Thesis language:	angličtina
Department:	Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor:	Mgr. et Mgr. Ondřej Dušek, Ph.D.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	06.05.2022
Date of assignment:	11.05.2022
Confirmed by Study dept. on:	20.05.2022
Date and time of defence:	29.06.2023 09:00
Date of electronic submission:	02.05.2023
Date of submission of printed version:	02.05.2023
Date of proceeded defence:	29.06.2023
Opponents:	Mgr. Nino Peterek, Ph.D.



Advisors:	RNDr. Jan Cuřin, Ph.D.

Guidelines

Cílem práce je vytvořit modul pro generování číslic a datumů v rozepsané formě (například “jedna”, “jedna” nebo “jedno” místo “1”, “pátého května” místo “5.5.”) v českém jazyce pro účely normalizace textu. Úkolem je dogenerovat slovní vyjádření číslic v různých alternativách (pády: druhého, rod: pátá, alternativní znění: tisíc devět set / devatenáct set) a poté aplikovat metody NLP na výběr nejlepší (nejpravděpodobnější) varianty. Jako trénovací a testovací data budou použity veřejně dostupné zdroje v českém jazyce, například korpusy PDT a ČNK. Pro finální výběr vhodné alternativy slovního vyjádření ve větě předpokládáme použití existujících modelů pro češtinu, například Czert, RobeCzech nebo multilingual BERT model. Součástí práce bude vyhodnocení přesnosti systému na vzorku vět.

References

HLAING, Aye Mya; PA, Win Pa; THU, Ye Kyaw. Myanmar Number Normalization for Text-to-Speech. In: International Conference of the Pacific Association for Computational Linguistics. Springer, Singapore, 2017. S. 263-274.

BOLLMANN, Marcel. A large-scale comparison of historical text normalization systems. arXiv preprint arXiv:1904.02036, 2019.

ZHANG, Hao, et al. Neural models of text normalization for speech applications. Computational Linguistics, 2019, 45. Jg., Nr. 2, S. 293-337.

LUSETTI, Massimo, et al. Encoder-decoder methods for text normalization. In: "Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018), 2018. S. 18-28