Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Sémantická analýza textu pomocí metod hlubokého učení
Thesis title in Czech: Sémantická analýza textu pomocí metod hlubokého učení
Thesis title in English: Semantic Text Analysis by Deep Learning
Key words: semantická analýza, závislostní syntax, hluboké učení, umělé neuronové sítě, treebanky, Prařský závislostní korpus
English key words: semantic analysis, dependency syntax, deep learning, artificial neural networks, treebanks, Prague Dependency Treebank
Academic year of topic announcement: 2022/2023
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: prof. RNDr. Jan Hajič, Dr.
Author:
Advisors: RNDr. Milan Straka, Ph.D.
Guidelines
Sémantická analýza textu se řeší v oblasti počítačové lingvistiky a zpracování přirozeného jazyka více než 10 let, dosud však nedává uspokojivé výsledky, zejména při vícejazyčném nasazení. Cílem diplomové práce bude navrhnout a experimentálně ověřit metody sémantické analýzy (alespoň) češtiny a angličtiny, kdy vstupem je běžný text, a výstupem je formalizovaná podoba (graf) sémantické reprezentace takového textu; jednotkou na výstupu je jedna věta, případně i více vět najednou (reprezentovaných jedním grafem). Experimentální ověření zahrnuje evaluaci standardními metodami podle typu testovacích dat, a tyto výsledky budou porovnány s existujícími systémy. Data (korpusy PDT, PCEDT, CoNLL 2009, *SEM, případně další) budou poskytnuty pracovištěm vedoucího, stejně jako přístup k výpočetním serverům v kapacitě adekvátní řešenému problému.
References
Hajič Jan, Ciaramita Massimiliano, Johansson Richard, Kawahara Daisuke, Martí Maria Antònia, Màrquez Lluís, Meyers Adam, Nivre Joakim, Padó Sebastian, Štěpánek Jan, Straňák Pavel, Surdeanu Mihai, Xue Nianwen, Zhang Yi: The CoNLL-2009 Shared Task: Syntactic and Semantic Dependencies in Multiple Languages. In: Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL): Shared Task, Boulder, CO, USA, ISBN 978-1-932432-29-9, pp. 1-18, 2009
Timothy Dozat, Christopher D. Manning: Deep Biaffine Attention For Neural Dependency Parsing. https://arxiv.org/pdf/1611.01734.pdf
Treex, http://ufal.mff.cuni.cz/treex a http://hdl.handle.net/11858/00-097C-0000-0023-44AF-C
Timothy Dozat, Christopher D. Manning: Simpler but More Accurate Semantic Dependency Parsing, https://arxiv.org/pdf/1807.01396.pdf
Stephan Oepen et al. 2014. SemEval 2014 Task 8: Broad-Coverage Semantic Dependency Parsing. In Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), pages 63–72. ACL Anthology ID: S14-2008
Stephan Oepen, Marco Kuhlmann, Yusuke Miyao, Daniel Zeman, Silvie Cinkova, Dan Flickinger, Jan Hajic, and Zdenka Uresova: SemEval 2015 Task 18: Broad-Coverage Semantic Dependency Parsing. ACL Anthology ID: S15-2153
Prague Dependency Treebank 3.5, http://hdl.handle.net/11234/1-2621
Prague Czech-English Dependency Treebank 2.0, http://hdl.handle.net/11858/00-097C-0000-0015-8DAF-4
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html