Morphological segmentation of Czech Words
Název práce v češtině: | Morfologická segmentace českých slov |
---|---|
Název v anglickém jazyce: | Morphological segmentation of Czech Words |
Klíčová slova: | morfém, morfologie, segmentace, stemming |
Klíčová slova anglicky: | morpheme, morphology, segmentation, stemming |
Akademický rok vypsání: | 2017/2018 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 05.04.2018 |
Datum zadání: | 05.04.2018 |
Datum potvrzení stud. oddělením: | 09.05.2018 |
Datum a čas obhajoby: | 11.09.2018 00:00 |
Datum odevzdání elektronické podoby: | 21.08.2018 |
Datum odevzdání tištěné podoby: | 20.07.2018 |
Datum proběhlé obhajoby: | 11.09.2018 |
Oponenti: | RNDr. David Mareček, Ph.D. |
Zásady pro vypracování |
V lingvistice se používá pojem morfému jako nejmenší jazykové jednotky, z níž se skládají slova a která nese sémantickou nebo syntaktickou informaci [1]. Existuje několik segmentačních nástrojů využívajících neřízené strojové učení, např. Morfessor [1] a Affisix [3]. Jejich výhodou je univerzální použitelnost napříč jazyky, nevýhodou je, že výstup nemusí odpovídat lingvistické představě o morfémech v daném jazyce. Cílem diplomové práce je navrhnout a implementovat postup, který s využitím metod strojového učení a slovotvorné informace obsažené v síti DeriNet [6] i v existujících morfematických slovnících [5] a [7] nalezne lingvisticky relevantní segmentaci všech lemmat obsažených v DeriNetu. |
Seznam odborné literatury |
[1] CREUTZ, Mathias; LAGUS, Krista, 2005. Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1.0. In: Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1.0. Technical Report A81, Publications in Computer and Information Science. Helsinki University of Technology.
[2] DOKULIL, Miloš, 1962. Tvoření slov v češtině 1. Teorie odvozování slov. Nakladatelství Československé akademie věd. [3] HRUŠECKÝ, Michal, 2008. České předpony. Praha, Česká Republika. Diplomová práce. Univerzita Karlova. Vedoucí práce Jaroslava HLAVÁČOVÁ. [4] KOSKENNIEMI, Kimmo, 1983. Two-level Morphology: A General Computational Model for Word-Form Recognition and Production. ISBN 951-45-3201-5. ISSN 0355-7170. Disertační práce. Department of General Linguistics, University of Helsinki. [5] SLAVÍČKOVÁ, Eleonora, 1975. Retrográdní morfematický slovník češtiny. Academia. [6] ŠEVČÍKOVÁ, Magda; ŽABOKRTSKÝ, Zdeněk, 2014. Word-Formation Network for Czech. Proceedings of LREC 2014. [7] ŠIŠKA, Zbyněk, 1998. Bázový morfematický slovník češtiny. Univerzita Palackého v Olomouci. ISBN 80-7067-885-2. |