[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Tamchyna, Aleš Fraser, Alexander Bojar, Ondřej Junczys-Dowmunt, Marcin
Title Target-Side Context for Discriminative Models in Statistical Machine Translation
Czech title Cílový kontext v diskriminativních modelech strojového překladu
Proceedings 2016: Stroudsburg, PA, USA: ACL 2016: Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
Pages range 1704-1714
How published online
URL https://www.aclweb.org/anthology/P/P16/P16-1161.pdf
Supported by 2015-2018 H2020-ICT-2014-1-644402 (Himl (Health in my Language)) 2015-2018 H2020-ICT-2014-1-645452 (QT21: Quality Translation 21) 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Diskriminativní překladové modely, které využívají zdrojový kontext, zlepšují kvalitu statistického strojového překladu. V tomto článku navrhujeme nové rozšíření, které navíc využívá i informace z cílového kontextu. Ukazujeme, že i takový model lze efektivně integrovat přímo do procesu dekódování. Náš přístup lze uplatnit i na velká trénovací data a jeho využití konzistentně zlepšuje kvalitu překladu u čtyř jazykových párů. Analyzujeme také zvlášť přínos zdrojového a cílového kontextu a ukazujeme, že toto rozšíření lépe zachycuje morfologickou shodu. Model je volně dostupný v rámci softwaru Moses.
English abstract Discriminative translation models utilizing source context have been shown to help statistical machine translation performance. We propose a novel extension of this work using target context information. Surprisingly, we show that this model can be efficiently integrated directly in the decoding process. Our approach scales to large training data sizes and results in consistent improvements in translation quality on four language pairs. We also provide an analysis comparing the strengths of the baseline source-context model with our extended source-context and target-context model and we show that our extension allows us to better capture morphological coherence. Our work is freely available as part of Moses.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
ISBN* 978-1-945626-00-5
Address* Stroudsburg, PA, USA
Month* August
Venue* Humboldt University
Publisher* Association for Computational Linguistics
Institution* Association for Computational Linguistics
Organization* Association for Computational Linguistics
Creator: Common Account
Created: 5/25/16 12:52 PM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Sun Nov 19 00:31:31 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant