Multilingual Learning using Syntactic Multi-Task Training
Název práce v češtině: | Vícejazyčné učení pomocí víceúlohového trénování syntaxe |
Název v anglickém jazyce: | Multilingual Learning using Syntactic Multi-Task Training |
Akademický rok vypsání: | 2018/2019 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Milan Straka, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 14.02.2019 |
Datum zadání: | 14.02.2019 |
Datum potvrzení stud. oddělením: | 25.04.2019 |
Datum a čas obhajoby: | 11.06.2019 09:00 |
Datum odevzdání elektronické podoby: | 10.05.2019 |
Datum odevzdání tištěné podoby: | 10.05.2019 |
Datum proběhlé obhajoby: | 11.06.2019 |
Oponenti: | RNDr. David Mareček, Ph.D. |
Recent research has shown promising results in learning syntactic representations of text for improving NLP models via transfer learning, e.g., for Machine Translation and Question Answering (Nadejde et al. 2017, Currey and Heafield 2018, Zhang et al. 2018, Franco-Salvador et al. 2018). The goal of the thesis is to investigate the use of embeddings pretrained on Universal Dependencies (McDonald et al. 2013) using a multi-task neural network (Straka 2018) for multilingual cross-domain transfer learning. Additionally, other approaches find improvement when pretraining unsupervised word representations for language modeling (Peters et al. 2018, Pennington et al. 2014). For instance, Google's recent BERT model (Devlin, et al. 2018) provides state-of-the-art multilingual representations of text useful for improving the performance of a wide range of NLP tasks. However, it is not particularly suitable for syntactic tasks without proper fine-tuning. The thesis will also investigate any possible improvements to BERT by fine-tuning its contextualized representations on Universal Dependencies treebanks, and evaluate these effects on multiple tasks across several languages. |
