Kategorizace úprav strojového překladu při post-editaci: jazyková kombinace angličtina - čeština
Název práce v češtině: | Kategorizace úprav strojového překladu při post-editaci: jazyková kombinace angličtina - čeština |
---|---|
Název v anglickém jazyce: | Classification of Edit Categories in Machine Translation Post-Editing: English-Czech Language Combination |
Klíčová slova: | MTPE|PEMT|posteditace|strojový překlad|kategorizace|úpravy |
Klíčová slova anglicky: | MTPE|PEMT|post-editing|machine translation|classification|edits |
Akademický rok vypsání: | 2020/2021 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav translatologie (21-UTRL) |
Vedoucí / školitel: | doc. PhDr. Bc. Tomáš Svoboda, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 17.05.2021 |
Datum zadání: | 17.05.2021 |
Schválení administrátorem: | zatím neschvalováno |
Datum potvrzení stud. oddělením: | 03.06.2021 |
Datum a čas obhajoby: | 09.09.2021 12:00 |
Datum odevzdání elektronické podoby: | 02.08.2021 |
Datum proběhlé obhajoby: | 09.09.2021 |
Odevzdaná/finalizovaná: | odevzdaná studentem a finalizovaná |
Oponenti: | Mgr. Věra Kloudová, Ph.D. |
Zásady pro vypracování |
Popis současné situace:
Strojový překlad prošel v posledních letech rychlým vývojem a jeho kvalita se neustále zvyšuje, a to hlavně po nástupu tzv. neurálního strojového překladu (NMT)[1]. Je proto pochopitelné, že právě strojový překlad dnes představuje odpověď na otázku, jak uspokojit stále větší poptávku po rychlém překladu velkého objemu textů. V posledním roce se mezi poskytovateli překladových služeb začal projevovat velký zájem o poskytování post-editace strojového překladu. Z průzkumu EUATC z roku 2020 vyplynulo, že 78 % dotazovaných poskytovatelů překladových služeb chce začít tuto službu poskytovat nebo ji začít poskytovat častěji než dosud.[2]Z úvah, zda je strojový překlad vhodný nástroj či nikoliv, se stále častěji začaly stávat úvahy, jak strojový překlad efektivně implementovat do překladatelského procesu. Je tedy zřejmé, že i práce překladatelů (zejména neliterárních textů) se bude nadále měnit z překládání na post-editování strojového překladu (MTPE). Co to pro ně znamená? V současné době jsou zmapované obecné rozdíly mezi kompetencemi, které ke své profesi potřebuje překladatel a které post-editor, jako například v článku Vivety Geneové[3], ale chybí nám studie a rozbor lingvistických kategorií, kterými se post-editoři zabývají při práci s konkrétní jazykovou kombinací angličtina - čeština. Cíle práce: Cílem této diplomové práce je analyzovat dataset složený ze souboru textů v originále (v anglickém jazyce), jejich strojových překladů do češtiny v několika verzích z několika překladačů, post-editací a následných revizí. Tento dataset vznikl primárně na zadání společnosti Memsource s cílem zkoumat souvislost mezi kvalitou strojového překladu a rychlostí post-editace. Řešitelka této práce je zaměstnaná ve společnosti Memsource a spolu se zástupcem společnosti se domluvili, že Memsource poskytne tento dataset řešitelce i pro další zkoumání. Post-editory a revizory zajistila společnost České překlady s.r.o. S kontaktní osobou na této straně je řešitelka taktéž ve spojení. Předmětem zkoumání této práce budou úpravy provedené jak post-editory, tak i změny provedené v následné fázi revize. Budeme se snažit tyto úpravy klasifikovat a kategorizovat, a dále pozorovat, zda případné kategorie úprav budou mít odlišné zastoupení ve fázi post-editace a revize. Tímto budeme chtít zjistit, zda je možné definovat kategorie chyb, které post-editoři nejvíce opravují a které naopak mají tendenci přehlížet. Důležité pro tento výzkum bude i zadání, které post-editoři dostali. Téma úrovně MTPE bude v této práci okomentováno. Rovněž se práce bude věnovat i problematice zkušenosti a odbornosti post-editorů. Každý z nich totiž v rámci prvotního výzkumu také vyplnil krátký dotazník o svým předchozích profesních zkušenostech. Odpovědi z těchto dotazníků bude mít řešitelka také k dispozici a v práci je okomentuje. Jelikož se momentálně na žádné české vysoké škole nebo univerzitě v rámci programů zaměřených na překladatelství angličtiny nevyučuje samostatný předmět věnovaný post-editaci strojového překladu, mohla by zjištění vyplývající z této práce pomoci při zavádění takového kurzu nebo zařazení systematické přípravy na práci post-editora jako součást stávající výuky. Pokyny k realizaci práce: V teoretické části studentka nejprve popíše cíle/hypotézy a zvolené metody práce, jejichž prostřednictvím se pokusí cílů dosáhnout, popřípadě hypotézy verifikovat či vyvrátit. Dále popíše zamýšlené přínosy práce v dané vědní (pod)oblasti. Důkladně prostuduje dostupné a relevantní primární a sekundární zdroje (rozumí se zdroje tištěné i on-line, a to ve všech jazycích, jež ovládá), přičemž bude čerpat z připojené bibliografie. Jako prvotní východisko pro vyhledávání zdrojů může sloužit např. Routledge Encyclopaedia of Translation Studies a dále bibliografická databáze BITRA. Žádoucí je též rešerše mezi kvalifikačními (např. diplomními) pracemi obhájenými v ÚTRL anebo v podobně zaměřených vysokoškolských pracovištích v ČR, popřípadě i v zahraničí. Na základě takto zmapované situace diplomandka charakterizuje stav zkoumané problematiky. V empirické části studentka popíše faktický postup získávání informací, tyto informace vyhodnotí (explanace výsledků) a vhodně začlení další okruhy zkoumání, které vyplynou ze zmapování problému v části teoretické, popřípadě již z empirického zpracovávání materiálu (rekurzivní postup zkoumání). Diplomantka průběžně shrnuje poznatky na konci jednotlivých hlavních kapitol. Celková zjištění usoustavní v závěru, přičemž neopomene provést explanaci zjištěných skutečností. Zde budou výsledky studie porovnány s počátečními hypotézami, předloženo shrnutí výsledků a nastíněn výhled zkoumané problematiky do budoucna. Autorka práci opatří bibliografickým soupisem použitých primárních i sekundárních zdrojů, včetně internetových, zpracovaným dle příslušné normy. Je nutné dodržet formální náležitosti stanovené Pravidly pro organizaci studia FF UK (zejména článek 19). [1]VIEIRA, Lucas Nunes, ALONSO, Lisa, BYWOOD, Lindsay. Introduction: Post-editing in practice – Process, product and networks. The Journal of Specialised Translation. 2019, 31. S. 2. [2]MARKING, Marion. Survey Reveals Impact of Covid-19 on Europe’s Language Industry. Slator. [online] [cit. 11.05.2021] Dostupné z: https://slator.com/industry-news/survey-reveals-impact-of-covid-19-on-europes-language-industry/ [3]GENE, Viveta. Changing Roles: From Translation to Post-Editing. Intertranslations.com [online] [cit. 02.04.2021]. Dostupné z:https://www.intertranslations.com/downloads/post-editing-whitepaper/ |
Seznam odborné literatury |
VIEIRA, Lucas Nunes, ALONSO, Lisa, BYWOOD, Lindsay. Introduction: Post-editing in practice – Process, product and networks. The Journal of Specialised Translation. 2019, 31, 2-13.
GENE, Viveta. Changing Roles: From Translation to Post-Editing. Intertranslations.com [online] [cit. 02.04.2021]. Dostupné z:https://www.intertranslations.com/downloads/post-editing-whitepaper/ MARKING, Marion. Survey Reveals Impact of Covid-19 on Europe’s Language Industry. Slator. [online] [cit. 11.05.2021] Dostupné z:https://slator.com/industry-news/survey-reveals-impact-of-covid-19-on-europes-language-industry/ ROTHWELL, Andrew, SVOBODA, T. Tracking Translator Training in Tools and Technologies: Findings of the EMT Survey 2017. The Journal of Specialised Translation. 2019, 32, 26-60. MOSSOP, Brian. Revising and editing for translators. Manchester: St. Jerome Publishing, 2001. Translation practices explained. ISBN 1-900650-45-2. ZEHNALOVÁ, Jitka. Kvalita a hodnocení překladu: modely a aplikace. V Olomouci: Univerzita Palackého, 2015. Olomouc modern language monographs / Univerzita Palackého v Olomouci. ISBN 978-80-244-4792-6. BOJAR, Ondřej. Čeština a strojový překlad: strojový překlad našincům, našinci strojovém překladu. Praha: Ústav formální a aplikované lingvistiky, c2012. Studies in computational and theoretical linguistics. ISBN 978-80-904571-4-0. HAUENSCHILD, Christa a Susanne HEIZMANN, ed. Machine translation and translation theory. Berlin: Walter de Gruyter, 1997. Text, translation, computational processing. ISBN 3-11-015486-2. CASTILHO, S., DOHERTY, S., GASPARI, F., & MOORKENS, J. (2018). Approaches to human and machine translation quality assessment. In J. Moorkens, S. Castilho, F. Gaspari, & S. Doherty (Ed.), Translation Quality Assessment: From Principles to Practice (s. 9–38). Springer International Publishing.https://doi.org/10.1007/978-3-319-91241-7_2 ČULO, O. (2014). Approaching Machine Translation from Translation Studies: A perspective on commonalities, potentials, differences. Proceedings of the Seventeenth Annual Conference of the European Association for Machine Translation (EAMT), 199–208. Gaspari, F., Almaghout, H., & Doherty, S. (2015). A survey of machine translation competences: Insights for translation technology educators and practitioners. Gaspari, F., Toral, A., Naskar, S. K., Groves, D., & Way, A. (2014). Perception vs Reality: Measuring Machine Translation Post-Editing Productivity. Third Workshop on Post-Editing Technology and Practice. Chan, S. (2010). A New Curriculum for the Teaching of Translation Technology: The Teaching of a Translation Project Course as a Case Study. Mellinger, C. D. (2017). Translators and machine translation: Knowledge and skills gaps in translator pedagogy. The Interpreter and Translator Trainer. Pošta, M. (2017a). Technologie ve službách překladatele: CAT, strojový překlad, korpusy. Svoboda, T. (2018). THE STATE OF THE (TRADE AND) ART IN TRANSLATION: PEMT AUTOMATION, MT, AND THE FUTURE. Translation Services in the Digital World: A Sneak Peek into the (near) Future. DG TRAD Conference, 16-17 October 2017. KOPONEN, M. (2016). Machine Translation Post-Editing and Effort: Empirical Studies on the Post-Editing Process. |