Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 285)
Detail práce
   Přihlásit přes CAS
Detection of contradictions in pairs of texts in Kazakh
Název práce v češtině: Detekce kontradikce mezi dvěma texty v kazaštině
Název v anglickém jazyce: Detection of contradictions in pairs of texts in Kazakh
Klíčová slova: kontradikce zpracování přirozeného jazyka kazaština
Klíčová slova anglicky: contradiction natural language processing Kazakh
Akademický rok vypsání: 2018/2019
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Rudolf Rosa, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 20.09.2018
Datum zadání: 20.09.2018
Datum potvrzení stud. oddělením: 21.09.2018
Zásady pro vypracování
Cílem bakalářské práce je implementovat nástroj, který umožní hledat kontradikce mezi dvěma texty v kazaštině.

Vstupem aplikace budou dva texty v kazaštině.
Úkolem aplikace bude:
- nalézt v textech věty, které hovoří o tomtéž
- nalézt v těchto větách případné kontradikce
Výstupem aplikace bude seznam vět s nalezenými kontradikcemi.

Aplikace bude implementována v jazyce Python, a bude využívat vhodné existující NLP nástroje a data (například Universal Dependencies, UDPipe, word2vec).
Seznam odborné literatury
Marneffe, Marie-Catherine, Anna N. Rafferty, and Christopher D. Manning. "Finding contradictions in text." Proceedings of ACL-08: HLT (2008): 1039-1047.

Padó, Sebastian, et al. "Deciding Entailment and Contradiction with Stochastic and Edit Distance-based Alignment." TAC. 2008.

Milan Straka and Jana Straková. Tokenizing, POS Tagging, Lemmatizing and Parsing UD 2.0 with UDPipe. In Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, Vancouver, Canada, August 2017.

Universal Dependencies, http://universaldependencies.org/

Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781(2013).

GIAMPICCOLO, Danilo, et al. The third pascal recognizing textual entailment challenge. In: Proceedings of the ACL-PASCAL workshop on textual entailment and paraphrasing. Association for Computational Linguistics, 2007. p. 1-9.

NGUYEN, Kim Anh; WALDE, Sabine Schulte im; VU, Ngoc Thang. Integrating distributional lexical contrast into word embeddings for antonym-synonym distinction. arXiv preprint arXiv:1605.07766, 2016.
 
Univerzita Karlova | Informační systém UK