Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Thesis title in Czech: Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Thesis title in English: How well do large language models understand Czech and Polish? The case of the morphological category of diminutives underepresented in training data
Academic year of topic announcement: 2023/2024
Thesis type: diploma thesis
Thesis language: čeština
Department: Institute of Czech Language and Theory of Communication (21-UCJTK)
Supervisor: PhDr. Jiří Milička, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 22.11.2023
Date of assignment: 11.12.2023
Administrator's approval: approved
Confirmed by Study dept. on: 01.02.2024
Submitted/finalized: no
Opponents: doc. Mgr. Jan Chromý, Ph.D.
 
 
 
Guidelines
Tato práce se zaměří na zkoumání jak morfologické rozdíly mezi jazyky ovlivňují jazykové modely. Předmětem zájmu této práce bude kategorie deminutiv, která byla kvůli výrazné převaze anglických textů v trénovacích datech nedostatečně reprezentována.
Pomocí růžných druhů promptů, např. plain zero shot, chain of thoughts a few shot, bude zkoumáno, zda jazykové modely dokážou morfologicky a sémanticky vysvětlit, co znamená deminutivum, přeložit ho, a porozumět pragmatice a sentimentu v reálném textu. Práce naváže také na koncept principiální rovnocenností všech jazyků, který vychází z díla Vladimíra Skaličky.
References
1. Bąk, P. (1977): Gramatyka języka polskiego. Warszawa: Wiedza Powszechna.
2. Čermák, F. (2012): Morfématika a slovotvorba češtiny. Praha: Nakladatelství Lidové Noviny.
3. Dokulil, M. (1986): Tvoření slov v češtině [v:] Mluvnice češtiny, Praha: Academia.
4. Grzegorczykowa, R. (1982): Zarys słowotwórstwa polskiego. Warszawa: Państwowe Wydawnictwo Naukowe.
5. Grzegorczykowa, R. (1984): Gramatyka współczesnego języka polskiego. Warszawa: Państwowe Wydawnictwo Naukowe.
6. 9. Hauser, P. (1980): Nauka o slovní zásobě. Praha: Státní pedagogické nakladatelství.
7. Havránek, B. (1980): Mluvnice česká. Praha: Státní pedagogické nakladatelství.
8. Kuhn, T. (2022): Struktura vědeckých revolucí. Praha: Oikoymenh.
9. Popper, K. (1992): Wiedza obiektywna. Ewolucyjna teoria epistemologiczna. Warszawa: Wydawnictwo Naukowe PWN.
10. Skalička, V. (2004): Typ češtiny [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum.
11. Skalička, V. (2004): Typologie a komparatistika [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum.
12. Šmilauer, V. (1971): Novočeské tvoření slov. Praha: Státní Pedagogické Nakladatelství.
13. Štícha, F. (2018): Velká akademická gramatika spisovné češtiny. I. Morfologie: Druhy slov / Tvoření slov. Část 1. Praha: Academia
14. Zima, J. (1961): Expresivita slova v současné češtině. Studie lexikologická a stylistická. Praha: Nakladatelství Československé Akademie Věd.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html