Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Rozdílový valenční slovník pro strojový překlad příbuzných jazyků
Thesis title in Czech: Rozdílový valenční slovník pro strojový překlad příbuzných jazyků
Thesis title in English: Contrastive Valency Dictionary for Machine Translation between Related Languages
Academic year of topic announcement: 2009/2010
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Markéta Lopatková, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 12.11.2009
Date of assignment: 12.11.2009
Advisors: doc. RNDr. Vladislav Kuboň, Ph.D.
Guidelines
Cílem práce je vytvoření rozdílového valenčního slovníku pro strojový překlad mezi příbuznými jazyky založeného na slovníku českých sloves VALLEX.
Student bude vycházet z existujících paralelních korpusů, existujících překladových slovníků a valenčního slovníku VALLEX. Jeho úkolem bude identifikovat v daných korpusech odpovídající si slovesa a jejich doplnění. Pro daný výskyt slovesa určí možné valenční rámce ve VALLEXu a porovná jejich formy s formami slovesných doplnění v cílovém jazyce. Výstupem práce bude rozdílový slovník obsahující informaci o počtu a formě doplnění v povrchových rámcích slovesa v odpovídajících si lexikálních jednotkách a jejich vzájemné provázání.
K práci je možno využít existující nástroje pro zpracování dat (např. morfologie, tagging, parsing, alignment) a datové zdroje (paralelní korpusy a slovníky dostupné na pracovišti).
References
paralelní korpusy a překladové slovníky (v závislosti na cílovém jazyce)
http://ufal.mff.cuni.cz/umc/
http://www.korpus.cz/intercorp/
http://wt.jrc.it/lt/Acquis/

Lopatková, M., Žabokrtský, Z., Kettnerová, V. et al.: Valenční slovník českých sloves. Univerzita Karlova v Praze, Nakladatelství Karolinum, Praha, 2008.
http://ufal.mff.cuni.cz/vallex/2.5/doc/home.html

dokumentace k použitým nástrojům (morfologická a syntaktická analýza pro češtinu, morfologická analýza pro cílový jazyk, GIZA++, ...)

Spoustová, D., Hajič, J., Votrubec, J., Krbec, P., Květoň, P.: The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In Proceedings of Balto-Slavonic NLP Workshop. ACL, Prague, 2007. pp. 67--74

McDonald, R., Pereira, F., Ribarov, K., Hajič, J.: Non-Projective Dependency Parsing using Spanning Tree Algorithms. In Proceedings of Human Langauge Technology Conference and Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Vancouver, BC, Canada, 2005. pp. 523-530

Och, F.J., Ney, H.: A Systematic Comparison of Various Statistical Alignment Models, Computational Linguistics, volume 29, number 1, pp. 19-51 March 2003.
Preliminary scope of work
Cílem práce je vytvoření rozdílového valenční slovníku pro strojový překlad mezi příbuznými jazyky založeného na slovníku českých sloves VALLEX.
Preliminary scope of work in English
The goal of the work is to create contrastive valency lexicon for machine translation between related languages based on VALLEX lexicon.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html