[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Rosa, Rudolf Sudarikov, Roman Novák, Michal Popel, Martin Bojar, Ondřej
Title Dictionary-based Domain Adaptation of MT Systems without Retraining
Czech title Doménová adaptace strojových překladačů bez přetrénovávání založená na slovníku
Proceedings 2016: Stroudsburg, PA, USA: WMT 2016 (ACL): Proceedings of the First Conference on Machine Translation (WMT). Volume 2: Shared Task Papers
Pages range 449-455
How published online
URL http://www.statmt.org/wmt16/pdf/W16-2334.pdf
Supported by 2013-2016 FP7-ICT-2013-10-610516 (QTLeap) 2014-2016 GAUK 15723/2014 (Modelování závislostní syntaxe napříč jazyky) 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2016-2019 LM2015071 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Popisuje náš příspěvek do úlohy překladu v doméně IT na WMT16. Provádíme doménovou adaptaci již natrénovaných překladových systémů pomocí slovníkových dat bez dalšího trénování. Náš postup aplikujeme na dva konceptuálně odlišné překladače, vyvíjené v rámci projektu QTLeap -- TectoMT a Moses -- a na jejich kombinaci -- Chiméru. Všechny naše metody zlepšují ve všech experimentech kvalitu překladu. Základní varianta naší metody je navíc použitelná na libovolný překladový systém, včetně takového, který je pro uživatele černou skříňkou.
English abstract We describe our submission to the IT-domain translation task of WMT 2016. We perform domain adaptation with dictionary data on already trained MT systems with no further retraining. We apply our approach to two conceptually different systems developed within the QTLeap project: TectoMT and Moses, as well as Chimera, their combination. In all settings, our method improves the translation quality. Moreover, the basic variant of our approach is applicable to any MT system, including a black-box one.
Specialization computer science ("informatika")
Confidentiality default – not confidential
Open access no
Editor(s)* Ondřej Bojar
ISBN* 978-1-945626-10-4
Address* Stroudsburg, PA, USA
Month* August
Venue* Humboldt University
Publisher* Association for Computational Linguistics
Institution* Association for Computational Linguistics
Creator: Common Account
Created: 5/15/16 7:33 PM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 04:24:10 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant