Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Morphological segmentation of Czech Words
Název práce v češtině: Morfologická segmentace českých slov
Název v anglickém jazyce: Morphological segmentation of Czech Words
Klíčová slova: morfém, morfologie, segmentace, stemming
Klíčová slova anglicky: morpheme, morphology, segmentation, stemming
Akademický rok vypsání: 2017/2018
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 05.04.2018
Datum zadání: 05.04.2018
Datum potvrzení stud. oddělením: 09.05.2018
Datum a čas obhajoby: 11.09.2018 00:00
Datum odevzdání elektronické podoby:21.08.2018
Datum odevzdání tištěné podoby:20.07.2018
Datum proběhlé obhajoby: 11.09.2018
Oponenti: RNDr. David Mareček, Ph.D.
 
 
 
Zásady pro vypracování
V lingvistice se používá pojem morfému jako nejmenší jazykové jednotky, z níž se skládají slova a která nese sémantickou nebo syntaktickou informaci [1]. Existuje několik segmentačních nástrojů využívajících neřízené strojové učení, např. Morfessor [1] a Affisix [3]. Jejich výhodou je univerzální použitelnost napříč jazyky, nevýhodou je, že výstup nemusí odpovídat lingvistické představě o morfémech v daném jazyce. Cílem diplomové práce je navrhnout a implementovat postup, který s využitím metod strojového učení a slovotvorné informace obsažené v síti DeriNet [6] i v existujících morfematických slovnících [5] a [7] nalezne lingvisticky relevantní segmentaci všech lemmat obsažených v DeriNetu.
Seznam odborné literatury
[1] CREUTZ, Mathias; LAGUS, Krista, 2005. Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1.0. In: Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1.0. Technical Report A81, Publications in Computer and Information Science. Helsinki University of Technology.
[2] DOKULIL, Miloš, 1962. Tvoření slov v češtině 1. Teorie odvozování slov. Nakladatelství Československé akademie věd.
[3] HRUŠECKÝ, Michal, 2008. České předpony. Praha, Česká Republika. Diplomová práce. Univerzita Karlova. Vedoucí práce Jaroslava HLAVÁČOVÁ.
[4] KOSKENNIEMI, Kimmo, 1983. Two-level Morphology: A General Computational Model for Word-Form Recognition and Production. ISBN 951-45-3201-5. ISSN 0355-7170. Disertační práce. Department of General Linguistics, University of Helsinki.
[5] SLAVÍČKOVÁ, Eleonora, 1975. Retrográdní morfematický slovník češtiny. Academia.
[6] ŠEVČÍKOVÁ, Magda; ŽABOKRTSKÝ, Zdeněk, 2014. Word-Formation Network for Czech. Proceedings of LREC 2014.
[7] ŠIŠKA, Zbyněk, 1998. Bázový morfematický slovník češtiny. Univerzita Palackého v Olomouci. ISBN 80-7067-885-2.
 
Univerzita Karlova | Informační systém UK