Shrnutí napříč jazyky
Název práce v češtině: | Shrnutí napříč jazyky |
---|---|
Název v anglickém jazyce: | Cross-Language Summarization |
Klíčová slova: | shrnutí|CLS|XLS|NLP |
Klíčová slova anglicky: | Summarization|CLS|XLS|NLP |
Akademický rok vypsání: | 2024/2025 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Jiří Hana, Ph.D. |
Řešitel: | skrytý - zadáno vedoucím/školitelem |
Datum přihlášení: | 14.05.2024 |
Datum zadání: | 16.05.2024 |
Zásady pro vypracování |
The thesis should explore the methods for cross-language summarization (CLS).
CLS is a task when a document in one language is summarized in another language. Typically, this task involves machine translation before or after summarization, but there are also end-to-end methods. As part of the thesis, a prototype system should be developed and evaluated. It should summarize documents in a low-resource language, such as Maltese, in another language, for example, English. |
Seznam odborné literatury |
Wang, J. et al (2022) A Survey on Cross-Lingual Summarization. Transactions of the Association for Computational Linguistics 2022; 10 1304–1323. doi: https://doi.org/10.1162/tacl_a_00520
Bhattacharjee, A. et al (2021). CrossSum: Beyond English-Centric Cross-Lingual Summarization for 1,500+ Language Pairs. arXiv:2112.08804. Huot, F.et al (2023). μPLAN: Summarizing using a Content Plan as Cross-Lingual Bridge. arXiv:2305.14205. Wan, X. et al (2010). Cross-language document summarization based on machine translation quality prediction. In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (pp. 917-926). Ladhak, F. et al (2020). WikiLingua: A new benchmark dataset for cross-lingual abstractive summarization. arXiv:2010.03093. |