Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Morfologická segmentace pro více jazyků
Název práce v češtině: Morfologická segmentace pro více jazyků
Název v anglickém jazyce: Multilingual morphological segmentation
Klíčová slova: morpheme, morphological segmentation, multilingual segmentation
Akademický rok vypsání: 2019/2020
Typ práce: disertační práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.09.2020
Datum zadání: 23.09.2020
Datum potvrzení stud. oddělením: 30.09.2020
Zásady pro vypracování
Za nejmenší jednotku jazyka, které nese samostatně význam, je považován morfém ([1]). Cílem práce je prozkoumat datové zdroje relevantní pro segmentaci na morfémy v různých jazycích a dále navrhnout metodu, kterou by bylo možné použít pro různé jazyky (a často také rozmanité kombinace dostupných datových zdrojů) k automatické indukci hranic mezi morfémy. Součástí práce bude vyhodnocení úspěšnosti segmentace napříč jazyky a srovnání s předchozími přístupy (mj. [2] a [3]).
Seznam odborné literatury
[1] Miroslav Dokulil: Tvoření slov v češtině 1: Teorie odvozování slov, Nakladatelství Československé Akademie Věd, Praha, 1962.
[2] Grönroos, Stig-Arne, et al. "Morfessor FlatCat: An HMM-based method for unsupervised and semi-supervised learning of morphology." Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Technical Papers. 2014.
[3] Bergmanis, Toms, and Sharon Goldwater. "From segmentation to analyses: a probabilistic model for unsupervised morphology induction." Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers. 2017.
 
Univerzita Karlova | Informační systém UK