Detection of contradictions in pairs of texts in Kazakh
Název práce v češtině: | Detekce kontradikce mezi dvěma texty v kazaštině |
---|---|
Název v anglickém jazyce: | Detection of contradictions in pairs of texts in Kazakh |
Klíčová slova: | kontradikce zpracování přirozeného jazyka kazaština |
Klíčová slova anglicky: | contradiction natural language processing Kazakh |
Akademický rok vypsání: | 2018/2019 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Rudolf Rosa, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 20.09.2018 |
Datum zadání: | 20.09.2018 |
Datum potvrzení stud. oddělením: | 21.09.2018 |
Datum a čas obhajoby: | 05.09.2019 09:00 |
Datum odevzdání elektronické podoby: | 19.07.2019 |
Datum odevzdání tištěné podoby: | 19.07.2019 |
Datum proběhlé obhajoby: | 05.09.2019 |
Oponenti: | Mgr. et Mgr. Ondřej Dušek, Ph.D. |
Zásady pro vypracování |
Cílem bakalářské práce je implementovat nástroj, který umožní hledat kontradikce mezi dvěma texty v kazaštině.
Vstupem aplikace budou dva texty v kazaštině. Úkolem aplikace bude: - nalézt v textech věty, které hovoří o tomtéž - nalézt v těchto větách případné kontradikce Výstupem aplikace bude seznam vět s nalezenými kontradikcemi. Aplikace bude implementována v jazyce Python, a bude využívat vhodné existující NLP nástroje a data (například Universal Dependencies, UDPipe, word2vec). |
Seznam odborné literatury |
Marneffe, Marie-Catherine, Anna N. Rafferty, and Christopher D. Manning. "Finding contradictions in text." Proceedings of ACL-08: HLT (2008): 1039-1047.
Padó, Sebastian, et al. "Deciding Entailment and Contradiction with Stochastic and Edit Distance-based Alignment." TAC. 2008. Milan Straka and Jana Straková. Tokenizing, POS Tagging, Lemmatizing and Parsing UD 2.0 with UDPipe. In Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, Vancouver, Canada, August 2017. Universal Dependencies, http://universaldependencies.org/ Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781(2013). GIAMPICCOLO, Danilo, et al. The third pascal recognizing textual entailment challenge. In: Proceedings of the ACL-PASCAL workshop on textual entailment and paraphrasing. Association for Computational Linguistics, 2007. p. 1-9. NGUYEN, Kim Anh; WALDE, Sabine Schulte im; VU, Ngoc Thang. Integrating distributional lexical contrast into word embeddings for antonym-synonym distinction. arXiv preprint arXiv:1605.07766, 2016. |