Klasifikátor morfů
Thesis title in Czech: | Klasifikátor morfů |
---|---|
Thesis title in English: | Morph classifier |
Key words: | morf|morfém|morfematická analýza|segmentace |
English key words: | morph|morpheme|morphematic analysis|segmentation |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 05.04.2023 |
Date of assignment: | 14.04.2023 |
Confirmed by Study dept. on: | 02.05.2023 |
Guidelines |
Slova v přirozených jazycích lze rozložit na morfy - minimální jednotky lingvistické formy [1]. Morfy lze klasifikovat podle různých kritérií a s různou granularitou, například od dělení jen na kořeny a afixy přes využití specifičtější pojmů jako prefix, sufix, infix, interfix a circumfix až po členění do desítek sémantičtěji vymezených skupin, např. s využitím Leipzig Glossing Rules [2]. Úkolem studenta je seznámit se s existujícími inventáři typů morfů. Student dále s využitím relevantních jazykových dat (např. [3] a [4]) navrhne a implementuje automatický klasifikátor morfů, aplikuje jej na několik jazyků a vyhodnotí jeho úspěšnost. |
References |
[1] Haspelmath, Martin. "The morph as a minimal linguistic form." Morphology 30.2 (2020): 117-134.
[2] Comrie, Bernard, Martin Haspelmath, and Balthasar Bickel. "The Leipzig Glossing Rules: Conventions for interlinear morpheme-by-morpheme glosses." Department of Linguistics of the Max Planck Institute for Evolutionary Anthropology & the Department of Linguistics of the University of Leipzig. Retrieved January 28 (2008): 2010. [3] Batsuren, Khuyagbaatar, et al. "The sigmorphon 2022 shared task on morpheme segmentation." arXiv preprint arXiv:2206.07615 (2022). [4] Žabokrtský, Zdeněk, et al. "Towards Universal Segmentations: UniSegments 1.0." Proceedings of the Thirteenth Language Resources and Evaluation Conference. 2022. |