Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 336)
Detail práce
   Přihlásit přes CAS
Exploring Benefits of Transfer Learning in Neural Machine Translation
Název práce v češtině: Zkoumání výhod přenosu znalostí v neuronovém strojovém překladu
Název v anglickém jazyce: Exploring Benefits of Transfer Learning in Neural Machine Translation
Klíčová slova: transfer znalostí, strojový překlad, hluboké neuronové sítě, jazyky s málo zdroji
Klíčová slova anglicky: transfer learning, machine translation, deep neural networks, low-resource languages
Akademický rok vypsání: 2015/2016
Typ práce: disertační práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 25.09.2015
Datum zadání: 25.09.2015
Datum potvrzení stud. oddělením: 05.10.2015
Datum a čas obhajoby: 05.12.2019 14:00
Datum odevzdání elektronické podoby:30.09.2019
Datum odevzdání tištěné podoby:30.09.2019
Datum proběhlé obhajoby: 05.12.2019
Oponenti: Josef van Genabith
  RNDr. Jan Cuřin, Ph.D.
 
 
Zásady pro vypracování
Umělé neuronové sítě se stále častěji ukazují jako vhodný prostředek pro řešení náročných úloh strojového učení, typicky v případech, kde je třeba značná míra zobecnění. V poslední době se objevují též modely strojového překladu založené na hlubokých neuronových sítích, v nichž lze spatřovat formální reprezentaci významu, tj. jakousi interlingvu, ovšem naučenou zcela automaticky pouze na základě příkladů přeložených vět a nikoli vybudovanou lidmi (např. formální logika).

Úkolem disertační práce je po širší rešerši využití neuronových sítí ve zpracování přirozeného jazyka studovat přístupy a modely vhodné pro strojový překlad. Prototypy neuronových překladových modelů nebo neuronových komponent dodaných k tradičním modelům strojového překladu je žádoucí vyhodnocovat standardními metodami hodnocení kvality strojového překladu, ručními i automatickými.

Při návrhu struktury nebo postupů učení neuronových sítí je vhodné využít již zavedené formální reprezentace významu věty, např. informace dostupné na jednotlivých rovinách jazykového popisu teorie FGD, a zkoumat, nakolik je tato lidmi dodaná znalost využitelná. Na druhou stranu by též bylo zajímavé pokusit se alespoň částečně naučené neuronové modely interpretovat a hledat korespondence mezi dílčími aspekty těchto modelů a tradičním formálním popisem.
Seznam odborné literatury
Karl Moritz Hermann. Distributed Representations for Compositional Semantics. University of Oxford. 2014.

Multilingual Models for Compositional Distributional Semantics. Karl Moritz Hermann, Phil Blunsom. In Proceedings of ACL. 2014.

Petr Sgall, Eva Hajičová a Jarmila Panevová. The Meaning of the Sentence and Its Semantic and Pragmatic Aspects. Academia/Reidel Publishing Company, Praha/Dordrecht, 1986.

Jan Hajič, Eva Hajičová, Jarmila Panevová, Petr Sgall, Ondřej Bojar, Silvie Cinková, Eva Fučíková, Marie Mikulová, Petr Pajas, Jan Popelka, Jiří Semecký, Jana Šindlerová, Jan Štěpánek, Josef Toman, Zdeňka Urešová a Zdeněk Žabokrtský. Announcing Prague Czech-English Dependency Treebank 2.0. In Proceedings of the Eighth International Language Resources and Evaluation Conference (LREC’12), str. 3153–3160, Istanbul, Turkey, květen 2012. ELRA, European Language Resources Association.
 
Univerzita Karlova | Informační systém UK