Vývoj derivačních sítí s využitím metod částečně řízeného strojového učení
Thesis title in Czech: | Vývoj derivačních sítí s využitím metod částečně řízeného strojového učení |
---|---|
Thesis title in English: | Semi-supervised machine learning methods for developing derivational networks |
Key words: | morfologie, slovotvorba, derivace, jazyky s nedostatkem datových zdrojů |
English key words: | morphology, word formation, derivation, under-resourced languages |
Academic year of topic announcement: | 2017/2018 |
Thesis type: | dissertation |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Author: | hidden![]() |
Date of registration: | 27.09.2018 |
Date of assignment: | 27.09.2018 |
Confirmed by Study dept. on: | 29.10.2018 |
Guidelines |
Narozdíl od flektivní morfologie, pro kterou jsou slovníky a morfologické analyzátory vyvíjeny již několik desetiletí, vznikají datové zdroje pro derivační slovotvorbu teprve v posledních letech, a to zatím pouze pro malé množství jazyků ([1], [2], [3]). Cílem práce ja zaměřit se na hledání co nejefektivnějších postupů pro vytváření derivačních sítí pro další jazyky, a to zejména s využitím metod částečně řízeného strojového učení. Lze očekávat, že jedním z možných postupů bude projekce derivací napříč jazyky, podobně jako v současných experimentech s mezijazykovým přenosem závislostních analyzátorů ([4]). |
References |
[1] Zeller, B.,Šnajder, J., and Padó, S. (2013). DErivBase: Inducing and Evaluating a Derivational Morphology Resource for German. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, pages 1201–1211, Sofia, Bulgaria.
[2] Baranes, M. and Sagot, B. (2014). A Language-independent Approach to Extracting Derivational Relations from an Inflectional Lexicon. In Proceedings of the 9th International Conference on Language Resources and Evaluation, pages 2793–2799, Reykjavik, Iceland. [3] Ševčíková, M. and Žabokrtský, Z. (2014). Word-Formation Network for Czech. In Proceedings of the 9th International Conference on Language Resources and Evaluation, pages 1087–1093, Reykjavik, Iceland. [4] Rosa, R., Žabokrtský, Z. (2017). Error Analysis of Cross-lingual Tagging and Parsing. In: Proceedings of the 16th International Workshop on Treebanks and Linguistic Theories, Univerzita Karlova, Praha, Czechia, ISBN 978-80-88132-04-2, pp. 106-118. |