Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Název práce v češtině: Jak rozumí češtině a polštině velké jazykové modely? Případ morfologické kategorie deminutiv s nedostatečnou reprezentací v trénovacích datech
Název v anglickém jazyce: How well do large language models understand Czech and Polish? The case of the morphological category of diminutives underepresented in training data
Akademický rok vypsání: 2023/2024
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav českého jazyka a teorie komunikace (21-UCJTK)
Vedoucí / školitel: PhDr. Jiří Milička, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.11.2023
Datum zadání: 11.12.2023
Schválení administrátorem: bylo schváleno
Datum potvrzení stud. oddělením: 01.02.2024
Odevzdaná/finalizovaná: ne
Oponenti: doc. Mgr. Jan Chromý, Ph.D.
 
 
 
Zásady pro vypracování
Tato práce se zaměří na zkoumání jak morfologické rozdíly mezi jazyky ovlivňují jazykové modely. Předmětem zájmu této práce bude kategorie deminutiv, která byla kvůli výrazné převaze anglických textů v trénovacích datech nedostatečně reprezentována.
Pomocí růžných druhů promptů, např. plain zero shot, chain of thoughts a few shot, bude zkoumáno, zda jazykové modely dokážou morfologicky a sémanticky vysvětlit, co znamená deminutivum, přeložit ho, a porozumět pragmatice a sentimentu v reálném textu. Práce naváže také na koncept principiální rovnocenností všech jazyků, který vychází z díla Vladimíra Skaličky.
Seznam odborné literatury
1. Bąk, P. (1977): Gramatyka języka polskiego. Warszawa: Wiedza Powszechna.
2. Čermák, F. (2012): Morfématika a slovotvorba češtiny. Praha: Nakladatelství Lidové Noviny.
3. Dokulil, M. (1986): Tvoření slov v češtině [v:] Mluvnice češtiny, Praha: Academia.
4. Grzegorczykowa, R. (1982): Zarys słowotwórstwa polskiego. Warszawa: Państwowe Wydawnictwo Naukowe.
5. Grzegorczykowa, R. (1984): Gramatyka współczesnego języka polskiego. Warszawa: Państwowe Wydawnictwo Naukowe.
6. 9. Hauser, P. (1980): Nauka o slovní zásobě. Praha: Státní pedagogické nakladatelství.
7. Havránek, B. (1980): Mluvnice česká. Praha: Státní pedagogické nakladatelství.
8. Kuhn, T. (2022): Struktura vědeckých revolucí. Praha: Oikoymenh.
9. Popper, K. (1992): Wiedza obiektywna. Ewolucyjna teoria epistemologiczna. Warszawa: Wydawnictwo Naukowe PWN.
10. Skalička, V. (2004): Typ češtiny [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum.
11. Skalička, V. (2004): Typologie a komparatistika [v:] Souborné dílo. II. díl. Praha: Nakladatelství Karolinum.
12. Šmilauer, V. (1971): Novočeské tvoření slov. Praha: Státní Pedagogické Nakladatelství.
13. Štícha, F. (2018): Velká akademická gramatika spisovné češtiny. I. Morfologie: Druhy slov / Tvoření slov. Část 1. Praha: Academia
14. Zima, J. (1961): Expresivita slova v současné češtině. Studie lexikologická a stylistická. Praha: Nakladatelství Československé Akademie Věd.
 
Univerzita Karlova | Informační systém UK