Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatická detekce přejatých slov
Název práce v češtině: Automatická detekce přejatých slov
Název v anglickém jazyce: Automatic detection of lexical borrowings
Klíčová slova: přejatá slova|automatická detekce|jazykové zdroje
Klíčová slova anglicky: lexical borrowings|automatic detection|language data resources
Akademický rok vypsání: 2023/2024
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Magda Ševčíková, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 20.02.2024
Datum zadání: 20.02.2024
Datum potvrzení stud. oddělením: 21.02.2024
Konzultanti: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Zásady pro vypracování
Přejímání slov je v přirozených jazycích jedním ze způsobů rozšiřování slovní zásoby. Přejatá slova se různým tempem a různou měrou přizpůsobují hláskovému a morfologickému systému přijímajícího jazyka, uchovávají si ovšem specifické rysy, ty jsou využívány pro jejich automatickou detekci (Miller & List 2023, Miller et al. 2020, List 2019, Tadmor 2009 ad.).
Cílem diplomové práce je navrhnout a implementovat automatické metody pro identifikaci slov s cizími kořeny v češtině a dalších jazycích. Experimenty budou vycházet z dostupných zdrojů jazykových dat, zvl. lexikálních databází a textových korpusů (World Loanword Database, Slovník cizích slov, DeriNet a další zdroje v kolekcích Universal Derivations, OPUS nebo InterCorp) a budou realizovány s využitím nástrojů pro zpracování přirozeného jazyka (FastAlign, UDPipe ad.). Úspěšnost experimentů bude vyhodnocena na základě existujících jazykových zdrojů.
Seznam odborné literatury
List, J.-M. (2019). Automated methods for the investigation of language contact, with a focus on lexical borrowing. Language and Linguistics Compass 13, e12355. https://doi.org/10.1111/lnc3.12355
Miller, J. & J.-M. List (2023). Detecting lexical borrowings from dominant languages in multilingual wordlists. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics, pp. 2591–2597.
Miller, J. et al. (2020). Using lexical language models to detect borrowings in monolingual wordlists. PLOS One, e0242709. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0242709
Tadmor, U. (2009). Loanwords in the world's languages: Findings and results. In M. Haspelmath & U. Tadmor (eds.), Loanwords in the world's languages: A comparative handbook. De Gruyter, pp. 55–75.
 
Univerzita Karlova | Informační systém UK