Normalization of numbers into spoken form for text-to-speech systems
Thesis title in Czech: | Normalizace čísel pro výslovnost syntézou řeči |
---|---|
Thesis title in English: | Normalization of numbers into spoken form for text-to-speech systems |
Key words: | normalizace českého textu|normalizace čísel|systém pro syntézu řeči|vážený konečný převodník |
English key words: | Czech text normalization|number normalization|text-to-speech systems|weighted finite-state transducer |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | Bachelor's thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. et Mgr. Ondřej Dušek, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 06.05.2022 |
Date of assignment: | 11.05.2022 |
Confirmed by Study dept. on: | 20.05.2022 |
Date and time of defence: | 29.06.2023 09:00 |
Date of electronic submission: | 02.05.2023 |
Date of submission of printed version: | 02.05.2023 |
Date of proceeded defence: | 29.06.2023 |
Opponents: | Mgr. Nino Peterek, Ph.D. |
Advisors: | RNDr. Jan Cuřin, Ph.D. |
Guidelines |
Cílem práce je vytvořit modul pro generování číslic a datumů v rozepsané formě (například “jedna”, “jedna” nebo “jedno” místo “1”, “pátého května” místo “5.5.”) v českém jazyce pro účely normalizace textu. Úkolem je dogenerovat slovní vyjádření číslic v různých alternativách (pády: druhého, rod: pátá, alternativní znění: tisíc devět set / devatenáct set) a poté aplikovat metody NLP na výběr nejlepší (nejpravděpodobnější) varianty. Jako trénovací a testovací data budou použity veřejně dostupné zdroje v českém jazyce, například korpusy PDT a ČNK. Pro finální výběr vhodné alternativy slovního vyjádření ve větě předpokládáme použití existujících modelů pro češtinu, například Czert, RobeCzech nebo multilingual BERT model. Součástí práce bude vyhodnocení přesnosti systému na vzorku vět. |
References |
HLAING, Aye Mya; PA, Win Pa; THU, Ye Kyaw. Myanmar Number Normalization for Text-to-Speech. In: International Conference of the Pacific Association for Computational Linguistics. Springer, Singapore, 2017. S. 263-274.
BOLLMANN, Marcel. A large-scale comparison of historical text normalization systems. arXiv preprint arXiv:1904.02036, 2019. ZHANG, Hao, et al. Neural models of text normalization for speech applications. Computational Linguistics, 2019, 45. Jg., Nr. 2, S. 293-337. LUSETTI, Massimo, et al. Encoder-decoder methods for text normalization. In: "Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018), 2018. S. 18-28 |