Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Thesis title in Czech: | Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech |
---|---|
Thesis title in English: | How well do large language models understand Czech and Polish? The case of the morphological category of diminutives underepresented in training data |
Academic year of topic announcement: | 2023/2024 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Institute of Czech Language and Theory of Communication (21-UCJTK) |
Supervisor: | PhDr. Jiří Milička, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 22.11.2023 |
Date of assignment: | 11.12.2023 |
Administrator's approval: | approved |
Confirmed by Study dept. on: | 01.02.2024 |
Submitted/finalized: | no |
Opponents: | doc. Mgr. Jan Chromý, Ph.D. |
Guidelines |
Tato práce se zaměří na zkoumání jak morfologické rozdíly mezi jazyky ovlivňují jazykové modely. Předmětem zájmu této práce bude kategorie deminutiv, která byla kvůli výrazné převaze anglických textů v trénovacích datech nedostatečně reprezentována. Pomocí růžných druhů promptů, např. plain zero shot, chain of thoughts a few shot, bude zkoumáno, zda jazykové modely dokážou morfologicky a sémanticky vysvětlit, co znamená deminutivum, přeložit ho, a porozumět pragmatice a sentimentu v reálném textu. Práce naváže také na koncept principiální rovnocenností všech jazyků, který vychází z díla Vladimíra Skaličky. |
References |
1. Bąk, P. (1977): Gramatyka języka polskiego. Warszawa: Wiedza Powszechna. 2. Čermák, F. (2012): Morfématika a slovotvorba češtiny. Praha: Nakladatelství Lidové Noviny. 3. Dokulil, M. (1986): Tvoření slov v češtině [v:] Mluvnice češtiny, Praha: Academia. 4. Grzegorczykowa, R. (1982): Zarys słowotwórstwa polskiego. Warszawa: Państwowe Wydawnictwo Naukowe. 5. Grzegorczykowa, R. (1984): Gramatyka współczesnego języka polskiego. Warszawa: Państwowe Wydawnictwo Naukowe. 6. 9. Hauser, P. (1980): Nauka o slovní zásobě. Praha: Státní pedagogické nakladatelství. 7. Havránek, B. (1980): Mluvnice česká. Praha: Státní pedagogické nakladatelství. 8. Kuhn, T. (2022): Struktura vědeckých revolucí. Praha: Oikoymenh. 9. Popper, K. (1992): Wiedza obiektywna. Ewolucyjna teoria epistemologiczna. Warszawa: Wydawnictwo Naukowe PWN. 10. Skalička, V. (2004): Typ češtiny [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum. 11. Skalička, V. (2004): Typologie a komparatistika [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum. 12. Šmilauer, V. (1971): Novočeské tvoření slov. Praha: Státní Pedagogické Nakladatelství. 13. Štícha, F. (2018): Velká akademická gramatika spisovné češtiny. I. Morfologie: Druhy slov / Tvoření slov. Část 1. Praha: Academia 14. Zima, J. (1961): Expresivita slova v současné češtině. Studie lexikologická a stylistická. Praha: Nakladatelství Československé Akademie Věd. |