[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2012
Type in proceedings
Status published
Language English
Author(s) Galuščáková, Petra Bojar, Ondřej
Title Improving SMT by Using Parallel Data of a Closely Related Language
Czech title Vylepšenie štatistického automatického prekladu pomocou paralelných dát blízkych jazykov
Proceedings 2012: Amsterdam, Netherlands: Baltic HLT 2012: Human Language Technologies – The Baltic Perspective - Proceedings of the Fifth International Conference Baltic HLT 2012
Pages range 58-65
URL http://www.booksonline.iospress.nl/Content/View.aspx?piid=32319
Supported by 2009-2012 FP7-ICT-2007-3-231720 (EuroMatrix Plus) 2012 SVV 265 314 (Teoretické základy informatiky a výpočetní lingvistiky) 2009-2012 7E09003 (EuroMatrixPlus – Bringing Machine Translation for European Languages to the User) 2011-2012 7E11051 (EuroMatrixPlus - Enlarged European Union Bringing Machine Translation for European Languages to the User) 2010-2012 GPP406/10/P259 (Hybridní frázový a hloubkově-syntaktický strojový překlad) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Množstvo trénovacích dát je pre kvalitu štatistického strojového prekladu rozhodujúce. V článku popisujeme, akým spôsobom je možné zlepšiť kvalitu prekladu pre daný jazykový pár pomocou využitia paralelných dát v príbuznom jazyku. Konkrétne sme vylepšili en→sk preklad pomocou využitia veľkého česko-anglického paralelného korpusu a cs→sk prekladového systému založeného na pravidlách. Preskúmaných je niekoľko možností konfigurácie použitých systémov.
English abstract The amount of training data in statistical machine translation is critical for translation quality. In this paper, we demonstrate how to increase translation quality for one language pair by bringing in parallel data from a closely related language. In particular, we improve en→sk translation using a large Czech–English parallel corpus and a shallow (rule-based) MT system for cs→sk. Several setup options are explored in order to identify the best possible configuration.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
DOI 10.3233/978-1-61499-133-5-58
ISBN* 978-1-61499-132-8
Address* Amsterdam, Netherlands
Month* October
Publisher* IOS Press
Creator: Common Account
Created: 6/20/12 11:23 PM
Modifier: Almighty Admin
Modified: 9/6/13 4:50 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 02:51:34 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant