Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Klasifikátor morfů
Název práce v češtině: Klasifikátor morfů
Název v anglickém jazyce: Morph classifier
Klíčová slova: morf|morfém|morfematická analýza|segmentace
Klíčová slova anglicky: morph|morpheme|morphematic analysis|segmentation
Akademický rok vypsání: 2022/2023
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 05.04.2023
Datum zadání: 14.04.2023
Datum potvrzení stud. oddělením: 02.05.2023
Datum a čas obhajoby: 12.06.2024 09:00
Datum odevzdání elektronické podoby:01.05.2024
Oponenti: Mgr. Jindřich Helcl, Ph.D.
 
 
 
Zásady pro vypracování
Slova v přirozených jazycích lze rozložit na morfy - minimální jednotky lingvistické formy [1]. Morfy lze klasifikovat podle různých kritérií a s různou granularitou, například od dělení jen na kořeny a afixy přes využití specifičtější pojmů jako prefix, sufix, infix, interfix a circumfix až po členění do desítek sémantičtěji vymezených skupin, např. s využitím Leipzig Glossing Rules [2]. Úkolem studenta je seznámit se s existujícími inventáři typů morfů. Student dále s využitím relevantních jazykových dat (např. [3] a [4]) navrhne a implementuje automatický klasifikátor morfů, aplikuje jej na několik jazyků a vyhodnotí jeho úspěšnost.
Seznam odborné literatury
[1] Haspelmath, Martin. "The morph as a minimal linguistic form." Morphology 30.2 (2020): 117-134.
[2] Comrie, Bernard, Martin Haspelmath, and Balthasar Bickel. "The Leipzig Glossing Rules: Conventions for interlinear morpheme-by-morpheme glosses." Department of Linguistics of the Max Planck Institute for Evolutionary Anthropology & the Department of Linguistics of the University of Leipzig. Retrieved January 28 (2008): 2010.
[3] Batsuren, Khuyagbaatar, et al. "The sigmorphon 2022 shared task on morpheme segmentation." arXiv preprint arXiv:2206.07615 (2022).
[4] Žabokrtský, Zdeněk, et al. "Towards Universal Segmentations: UniSegments 1.0." Proceedings of the Thirteenth Language Resources and Evaluation Conference. 2022.
 
Univerzita Karlova | Informační systém UK