Sémantická analýza textu pomocí metod hlubokého učení
Thesis title in Czech: | Sémantická analýza textu pomocí metod hlubokého učení |
---|---|
Thesis title in English: | Semantic Text Analysis by Deep Learning |
Key words: | semantická analýza, závislostní syntax, hluboké učení, umělé neuronové sítě, treebanky, Prařský závislostní korpus |
English key words: | semantic analysis, dependency syntax, deep learning, artificial neural networks, treebanks, Prague Dependency Treebank |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | prof. RNDr. Jan Hajič, Dr. |
Author: | |
Advisors: | RNDr. Milan Straka, Ph.D. |
Guidelines |
Sémantická analýza textu se řeší v oblasti počítačové lingvistiky a zpracování přirozeného jazyka více než 10 let, dosud však nedává uspokojivé výsledky, zejména při vícejazyčném nasazení. Cílem diplomové práce bude navrhnout a experimentálně ověřit metody sémantické analýzy (alespoň) češtiny a angličtiny, kdy vstupem je běžný text, a výstupem je formalizovaná podoba (graf) sémantické reprezentace takového textu; jednotkou na výstupu je jedna věta, případně i více vět najednou (reprezentovaných jedním grafem). Experimentální ověření zahrnuje evaluaci standardními metodami podle typu testovacích dat, a tyto výsledky budou porovnány s existujícími systémy. Data (korpusy PDT, PCEDT, CoNLL 2009, *SEM, případně další) budou poskytnuty pracovištěm vedoucího, stejně jako přístup k výpočetním serverům v kapacitě adekvátní řešenému problému. |
References |
Hajič Jan, Ciaramita Massimiliano, Johansson Richard, Kawahara Daisuke, Martí Maria Antònia, Màrquez Lluís, Meyers Adam, Nivre Joakim, Padó Sebastian, Štěpánek Jan, Straňák Pavel, Surdeanu Mihai, Xue Nianwen, Zhang Yi: The CoNLL-2009 Shared Task: Syntactic and Semantic Dependencies in Multiple Languages. In: Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL): Shared Task, Boulder, CO, USA, ISBN 978-1-932432-29-9, pp. 1-18, 2009
Timothy Dozat, Christopher D. Manning: Deep Biaffine Attention For Neural Dependency Parsing. https://arxiv.org/pdf/1611.01734.pdf Treex, http://ufal.mff.cuni.cz/treex a http://hdl.handle.net/11858/00-097C-0000-0023-44AF-C Timothy Dozat, Christopher D. Manning: Simpler but More Accurate Semantic Dependency Parsing, https://arxiv.org/pdf/1807.01396.pdf Stephan Oepen et al. 2014. SemEval 2014 Task 8: Broad-Coverage Semantic Dependency Parsing. In Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), pages 63–72. ACL Anthology ID: S14-2008 Stephan Oepen, Marco Kuhlmann, Yusuke Miyao, Daniel Zeman, Silvie Cinkova, Dan Flickinger, Jan Hajic, and Zdenka Uresova: SemEval 2015 Task 18: Broad-Coverage Semantic Dependency Parsing. ACL Anthology ID: S15-2153 Prague Dependency Treebank 3.5, http://hdl.handle.net/11234/1-2621 Prague Czech-English Dependency Treebank 2.0, http://hdl.handle.net/11858/00-097C-0000-0015-8DAF-4 |