Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 336)
Detail práce
   Přihlásit přes CAS
Sémantická analýza textu pomocí metod hlubokého učení
Název práce v češtině: Sémantická analýza textu pomocí metod hlubokého učení
Název v anglickém jazyce: Semantic Text Analysis by Deep Learning
Klíčová slova: semantická analýza, závislostní syntax, hluboké učení, umělé neuronové sítě, treebanky, Prařský závislostní korpus
Klíčová slova anglicky: semantic analysis, dependency syntax, deep learning, artificial neural networks, treebanks, Prague Dependency Treebank
Akademický rok vypsání: 2022/2023
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: prof. RNDr. Jan Hajič, Dr.
Řešitel:
Konzultanti: RNDr. Milan Straka, Ph.D.
Zásady pro vypracování
Sémantická analýza textu se řeší v oblasti počítačové lingvistiky a zpracování přirozeného jazyka více než 10 let, dosud však nedává uspokojivé výsledky, zejména při vícejazyčném nasazení. Cílem diplomové práce bude navrhnout a experimentálně ověřit metody sémantické analýzy (alespoň) češtiny a angličtiny, kdy vstupem je běžný text, a výstupem je formalizovaná podoba (graf) sémantické reprezentace takového textu; jednotkou na výstupu je jedna věta, případně i více vět najednou (reprezentovaných jedním grafem). Experimentální ověření zahrnuje evaluaci standardními metodami podle typu testovacích dat, a tyto výsledky budou porovnány s existujícími systémy. Data (korpusy PDT, PCEDT, CoNLL 2009, *SEM, případně další) budou poskytnuty pracovištěm vedoucího, stejně jako přístup k výpočetním serverům v kapacitě adekvátní řešenému problému.
Seznam odborné literatury
Hajič Jan, Ciaramita Massimiliano, Johansson Richard, Kawahara Daisuke, Martí Maria Antònia, Màrquez Lluís, Meyers Adam, Nivre Joakim, Padó Sebastian, Štěpánek Jan, Straňák Pavel, Surdeanu Mihai, Xue Nianwen, Zhang Yi: The CoNLL-2009 Shared Task: Syntactic and Semantic Dependencies in Multiple Languages. In: Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL): Shared Task, Boulder, CO, USA, ISBN 978-1-932432-29-9, pp. 1-18, 2009
Timothy Dozat, Christopher D. Manning: Deep Biaffine Attention For Neural Dependency Parsing. https://arxiv.org/pdf/1611.01734.pdf
Treex, http://ufal.mff.cuni.cz/treex a http://hdl.handle.net/11858/00-097C-0000-0023-44AF-C
Timothy Dozat, Christopher D. Manning: Simpler but More Accurate Semantic Dependency Parsing, https://arxiv.org/pdf/1807.01396.pdf
Stephan Oepen et al. 2014. SemEval 2014 Task 8: Broad-Coverage Semantic Dependency Parsing. In Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), pages 63–72. ACL Anthology ID: S14-2008
Stephan Oepen, Marco Kuhlmann, Yusuke Miyao, Daniel Zeman, Silvie Cinkova, Dan Flickinger, Jan Hajic, and Zdenka Uresova: SemEval 2015 Task 18: Broad-Coverage Semantic Dependency Parsing. ACL Anthology ID: S15-2153
Prague Dependency Treebank 3.5, http://hdl.handle.net/11234/1-2621
Prague Czech-English Dependency Treebank 2.0, http://hdl.handle.net/11858/00-097C-0000-0015-8DAF-4
 
Univerzita Karlova | Informační systém UK