[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type master's thesis
Status published
Language English
Author(s) Variš, Dušan
Title Automatic Error Correction of Machine Translation Output
Czech title Automatická korektura chyb ve výstupu strojového překladu
School Charles University in Prague, Faculty of Mathematics and Physics
Publisher's city and country Praha, Czech Republic
Total book pages 68
Month July
Note MLFix paper.
How published print
Czech abstract Představujeme MLFix, systém pro automatickou statistickou post-editaci, který je duchovním následníkem pravidlového systému, Depfixu. Cílem této práce bylo prozkoumat možné postupy automatické identifikace nejčastějších morfologických chyb tvořených současnými systémy pro strojový překlad a natrénovat vhodné statistické modely, které by byly postaveny na získaných znalostech. Provedli jsme automatickou i ruční evaluaci našeho systému a výsledky porovnali s Depfixem. Systém byl vyvíjen především na výstupech anglicko-českého strojového překladu, cílem ale bylo zobecnit post-editační proces tak, aby byl aplikovatelný na další jazykové páry. Upravili jsme původní pipeline, aby post-editovala výstupy anglicko-německého strojového překladu, a provedli dodatečnou evaluaci této modifikace.
English abstract We present MLFix, an automatic statistical post-editing system, which is a spiritual successor to the rulebased system, Depfix. The aim of this thesis was to investigate the possible approaches to automatic identification of the most common morphological errors produced by the state-of-the-art machine translation systems and to train sufficient statistical models built on the acquired knowledge. We performed both automatic and manual evaluation of the system and compared the results with Depfix. The system was mainly developed on the English-toCzech machine translation output, however, the aim was to generalize the post-editing process so it can be applied to other language pairs. We modified the original pipeline to post-edit English-German machine translation output and performed additional evaluation of this modification.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Creator: Common Account
Created: 10/19/16 1:16 PM
Modifier: Common Account
Modified: 10/19/16 1:21 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Mon Sep 25 22:25:34 CEST 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant