[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2013
Type article
Status published
Language English
Author(s) Tamchyna, Aleš Bojar, Ondřej
Title No Free Lunch in Factored Phrase-Based Machine Translation
Czech title Ve faktorovém frázovém strojovém překladu není nic zdarma
Journal Lecture Notes in Computer Science
Publisher's city and country Berlin/Heidelberg
Volume 7817
Pages range 210-223
Month March
Note ISBN 978-3-642-37256-8
How published print
URL http://www.springer.com/computer/database+management+%26+information+retrieval/book/978-3-642-37255-1
Supported by 2011-2013 GAP406/11/1499 (Čeština ve věku strojového překladu) 2012-2015 FP7-ICT-2011-7-288487 (MosesCore) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Faktorové modely byly úspěšně nasazeny pro řadu jazykových párů, kde zlepšily různé aspekty kvality překladu. V této práci analyzujeme toto paradigma a pokoušíme se automatizovat hledání kvalitních překladových systémů. Zkoumáme prostor možných faktorových systémů a shledáváme, že plně automatické hledání není proveditelné. Ukazujeme, že i když jsou k dispozici výsledky automatické evaluace, zacílení prohledávání je obtížné kvůli malým rozdílům mezi jednotlivými systémy. Tyto rozdíly jsou dále rozmazány náhodností ladění vah. Popisujeme heuristiku pro odhad složitosti faktorových modelů. Závěrem popisujeme možnosti "polo-automatického" prohledávání prostoru v několika směrech a vyhodnocujeme získané systémy.
English abstract Factored models have been successfully used in many language pairs to improve translation quality in various aspects. In this work, we analyze this paradigm in an attempt at automating the search for well-performing machine translation systems. We examine the space of possible factored systems, concluding that a fully automatic search for good configurations is not feasible. We demonstrate that even if results of automatic evaluation are available, guiding the search is difficult due to small differences between systems, which are further blurred by randomness in tuning. We describe a heuristic for estimating the complexity of factored models. Finally, we discuss the possibilities of a "semi-automatic" exploration of the space in several directions and evaluate the obtained systems.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
ISSN* 0302-9743
Publisher* Springer Verlag Heidelberg
Creator: Common Account
Created: 2/17/13 11:13 AM
Modifier: Common Account
Modified: 11/9/15 9:47 AM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Oct 19 19:03:13 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant