[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Avramidis, Eleftherios Macketanz, Vivien Burchardt, Aljoscha Helcl, Jindřich Uszkoreit, Hans
Title Deeper Machine Translation and Evaluation for German
Czech title Hlubší strojový překlad a evaluace pro němčinu
Proceedings 2016: Praha, Czechia: DMTW 2016: Proceedings of the 2nd Deep Machine Translation Workshop
Pages range 29-38
How published online
Supported by 2015-2018 H2020-ICT-2014-1-645452 (QT21: Quality Translation 21) 2013-2016 FP7-ICT-2013-10-610516 (QTLeap)
Czech abstract Tento článek popisuje systém hybridního strojového překladu (MT), který byl vytvořen pro překlad z angličtiny do němčiny v oblasti technické dokumentace. Systém je založen na třech různých systémech MT (frázový, pravidlový a neuronový), které jsou spojeny výběrovým mechanismem, který používá hluboké jazykové rysy v procesu strojového učení. Součástí je také podrobná manuální analýza chyb, kterou jsme provedli pomocí specializované "zkušební sady", která obsahuje vybrané příklady relevantních jevů. Zatímco automatické výsledky ukazují obrovské rozdíly mezi systémy, celkový průměrný počet chyb, které (ne) dělají, je pro všechny systémy velmi podobný. Podrobné rozdělení chyb však ukazuje, že systémy se chovají velmi odlišně, pokud jde o různé jevy.
English abstract This paper describes a hybrid Machine Translation (MT) system built for translating from English to German in the domain of technical documentation. The system is based on three different MT engines (phrase-based SMT, RBMT, neural) that are joined by a selection mechanism that uses deep linguistic features within a machine learning process. It also presents a detailed source-driven manual error analysis we have performed using a dedicated “test suite” that contains selected examples of relevant phenomena. While automatic scores show huge differences between the engines, the overall average number or errors they (do not) make is very similar for all systems. However, the detailed error breakdown shows that the systems behave very differently concerning the various phenomena.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Editor(s)* Jan Hajič; Gertjan van Noord; António Branco
ISBN* 978-80-88132-02-8
Address* Praha, Czechia
Month* October
Venue* University of Lisbon, Faculty of Sciences, Department of Informatics
Institution* ÚFAL MFF UK
Creator: Common Account
Created: 5/17/17 4:04 PM
Modifier: Common Account
Modified: 7/12/17 1:13 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Mon Sep 25 22:42:24 CEST 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant