Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Název práce v češtině: | Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech |
---|---|
Název v anglickém jazyce: | How well do large language models understand Czech and Polish? The case of the morphological category of diminutives underepresented in training data |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav českého jazyka a teorie komunikace (21-UCJTK) |
Vedoucí / školitel: | PhDr. Jiří Milička, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 22.11.2023 |
Datum zadání: | 11.12.2023 |
Schválení administrátorem: | bylo schváleno |
Datum potvrzení stud. oddělením: | 01.02.2024 |
Odevzdaná/finalizovaná: | ne |
Oponenti: | doc. Mgr. Jan Chromý, Ph.D. |
Zásady pro vypracování |
Tato práce se zaměří na zkoumání jak morfologické rozdíly mezi jazyky ovlivňují jazykové modely. Předmětem zájmu této práce bude kategorie deminutiv, která byla kvůli výrazné převaze anglických textů v trénovacích datech nedostatečně reprezentována. Pomocí růžných druhů promptů, např. plain zero shot, chain of thoughts a few shot, bude zkoumáno, zda jazykové modely dokážou morfologicky a sémanticky vysvětlit, co znamená deminutivum, přeložit ho, a porozumět pragmatice a sentimentu v reálném textu. Práce naváže také na koncept principiální rovnocenností všech jazyků, který vychází z díla Vladimíra Skaličky. |
Seznam odborné literatury |
1. Bąk, P. (1977): Gramatyka języka polskiego. Warszawa: Wiedza Powszechna. 2. Čermák, F. (2012): Morfématika a slovotvorba češtiny. Praha: Nakladatelství Lidové Noviny. 3. Dokulil, M. (1986): Tvoření slov v češtině [v:] Mluvnice češtiny, Praha: Academia. 4. Grzegorczykowa, R. (1982): Zarys słowotwórstwa polskiego. Warszawa: Państwowe Wydawnictwo Naukowe. 5. Grzegorczykowa, R. (1984): Gramatyka współczesnego języka polskiego. Warszawa: Państwowe Wydawnictwo Naukowe. 6. 9. Hauser, P. (1980): Nauka o slovní zásobě. Praha: Státní pedagogické nakladatelství. 7. Havránek, B. (1980): Mluvnice česká. Praha: Státní pedagogické nakladatelství. 8. Kuhn, T. (2022): Struktura vědeckých revolucí. Praha: Oikoymenh. 9. Popper, K. (1992): Wiedza obiektywna. Ewolucyjna teoria epistemologiczna. Warszawa: Wydawnictwo Naukowe PWN. 10. Skalička, V. (2004): Typ češtiny [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum. 11. Skalička, V. (2004): Typologie a komparatistika [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum. 12. Šmilauer, V. (1971): Novočeské tvoření slov. Praha: Státní Pedagogické Nakladatelství. 13. Štícha, F. (2018): Velká akademická gramatika spisovné češtiny. I. Morfologie: Druhy slov / Tvoření slov. Část 1. Praha: Academia 14. Zima, J. (1961): Expresivita slova v současné češtině. Studie lexikologická a stylistická. Praha: Nakladatelství Československé Akademie Věd. |