Vývoj derivačních sítí s využitím metod částečně řízeného strojového učení
Název práce v češtině: | Vývoj derivačních sítí s využitím metod částečně řízeného strojového učení |
---|---|
Název v anglickém jazyce: | Semi-supervised machine learning methods for developing derivational networks |
Klíčová slova: | morfologie, slovotvorba, derivace, jazyky s nedostatkem datových zdrojů |
Klíčová slova anglicky: | morphology, word formation, derivation, under-resourced languages |
Akademický rok vypsání: | 2017/2018 |
Typ práce: | disertační práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 27.09.2018 |
Datum zadání: | 27.09.2018 |
Datum potvrzení stud. oddělením: | 29.10.2018 |
Zásady pro vypracování |
Narozdíl od flektivní morfologie, pro kterou jsou slovníky a morfologické analyzátory vyvíjeny již několik desetiletí, vznikají datové zdroje pro derivační slovotvorbu teprve v posledních letech, a to zatím pouze pro malé množství jazyků ([1], [2], [3]). Cílem práce ja zaměřit se na hledání co nejefektivnějších postupů pro vytváření derivačních sítí pro další jazyky, a to zejména s využitím metod částečně řízeného strojového učení. Lze očekávat, že jedním z možných postupů bude projekce derivací napříč jazyky, podobně jako v současných experimentech s mezijazykovým přenosem závislostních analyzátorů ([4]). |
Seznam odborné literatury |
[1] Zeller, B.,Šnajder, J., and Padó, S. (2013). DErivBase: Inducing and Evaluating a Derivational Morphology Resource for German. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, pages 1201–1211, Sofia, Bulgaria.
[2] Baranes, M. and Sagot, B. (2014). A Language-independent Approach to Extracting Derivational Relations from an Inflectional Lexicon. In Proceedings of the 9th International Conference on Language Resources and Evaluation, pages 2793–2799, Reykjavik, Iceland. [3] Ševčíková, M. and Žabokrtský, Z. (2014). Word-Formation Network for Czech. In Proceedings of the 9th International Conference on Language Resources and Evaluation, pages 1087–1093, Reykjavik, Iceland. [4] Rosa, R., Žabokrtský, Z. (2017). Error Analysis of Cross-lingual Tagging and Parsing. In: Proceedings of the 16th International Workshop on Treebanks and Linguistic Theories, Univerzita Karlova, Praha, Czechia, ISBN 978-80-88132-04-2, pp. 106-118. |