[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Saleh, Shadi Pecina, Pavel
Date 4.9.2016
Title Reranking Hypotheses of Machine-Translated Queries for Cross-Lingual Information Retrieval
Czech title Přeuspořádávání hypotéz strojového překladu dotazů pro vícejazyčné vyhledávání informací
Proceedings 2016: Berlin, Germany: CLEF 2016: Experimental IR Meets Multilinguality, Multimodality, and Interaction 7th International Conference of the CLEF Association
Number 9822
Pages range 54-66
How published print
Supported by 2015-2017 H2020-ICT-2014-1-644753 (KConnect (Khresmoi Multilingual Medical Text Analysis, Search and Machine Translation Connected in a Thriving Data-Value Chain)) 2012-2016 PRVOUK P46 (Informatika) 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2012-2018 GBP103/12/G084 (Centrum pro multi-modální interpretaci dat velkého rozsahu)
Czech abstract Strojový překlad dotazů pro vícejazyčné vyhledávání informací je obvykle cílen na maximální překladovou kvalitu. To ovšem nemusí být optimální s ohledem na kvalitu vyhledávání a jiné překladové hypotézy mohou vést k lepším výsledkům vyhledávání. V tomto článku zkoumáme metodu využívající více možných překladů, které jsou přeuspořádávány pomocí metody založené na strojovém učení, která je optimalizována přímo na kvalitu překladu.
English abstract Machine Translation (MT) systems employed to translate queries for Cross-Lingual Information Retrieval typically produce single translation with maximum translation quality. This, however, might not be optimal with respect to retrieval quality and other translation variants might lead to better retrieval results. In this paper, we explore a method exploiting multiple translations produced by an MT system, which are reranked using a supervised machine-learning method trained to directly optimize the retrieval quality. We experiment with various types of features and the results obtained on the medical-domain test collection from the CLEF eHealth Lab series show significant improvement of retrieval quality compared to a system using single translation provided by MT.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
DOI 10.1007/978-3-319-44564-9_5
Editor(s)* Norbert Fuhr; Birger Larsen; Teresa Gonçalves; Kristzian Balog; Craig Macdonald; Linda Cappellato; Nicola Ferro; Paulo Quaresma
ISBN* 978-3-319-44563-2
ISSN* 0302-9743
Address* Berlin, Germany
Month* September
Publisher* Springer
Journal* Lecture Notes in Computer Science
Creator: Common Account
Created: 7/4/16 3:40 PM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Sat Nov 18 03:37:39 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant