Multimodality in Machine Translation
Název práce v češtině: | Multimodalita ve strojovém překladu |
---|---|
Název v anglickém jazyce: | Multimodality in Machine Translation |
Klíčová slova: | multimodal machine translation, neural machine translation, combining language and vision, deep learning |
Klíčová slova anglicky: | multimodální strojový překlad, neuronový strojový překlad, kombinování zpracování jazyka a obrazu, hluboké učení |
Akademický rok vypsání: | 2013/2014 |
Typ práce: | disertační práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 27.09.2013 |
Datum zadání: | 27.09.2013 |
Datum potvrzení stud. oddělením: | 11.12.2013 |
Datum a čas obhajoby: | 13.06.2019 10:10 |
Datum odevzdání elektronické podoby: | 21.03.2019 |
Datum odevzdání tištěné podoby: | 22.03.2019 |
Datum proběhlé obhajoby: | 13.06.2019 |
Oponenti: | Lucia Specia |
Jan Čech | |
Zásady pro vypracování |
Úlohu extrakce textu z obrazových dat lze rozdělit na dvě části: a) lokalizaci a rozpoznání jednotlivých znaků v jakýchkoliv obrazových datech (fotografie, video) a b) seskupení rozpoznaných znaků do slov a seřazení slov do frází a větších celků. Jádro disertační práce bude spočívat v aplikaci statistických metod strojového učení v části b), přičemž část a) bude řešena již existujícími nástroji [1]. |
Seznam odborné literatury |
[1] Lukas Neumann, Jiri Matas. A method for text localization and recognition in real-world images. In ACCV'10 Proceedings of the 10th Asian conference on Computer vision - Volume Part III, Pages 770-783, 2010.
[2] Keechul Jung , Kwang In Kim , Anil K. Jain: Text information extraction in images and video: a survey. Pattern Recognition, Vol. 37, No. 5., pp. 977-997, 2004. [3] Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999. |