[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Rosa, Rudolf Popel, Martin Bojar, Ondřej Mareček, David Dušek, Ondřej
Title Moses & Treex Hybrid MT Systems Bestiary
Czech title Bestiář hybridních systémů MT založených na Mosesu a Treexu
Proceedings 2016: Praha, Czechia: DMTW 2016: Proceedings of the 2nd Deep Machine Translation Workshop
Pages range 1-10
How published online
URL http://www.aclweb.org/anthology/W16-6401
Supported by 2016-2019 LM2015071 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2014-2016 GAUK 15723/2014 (Modelování závislostní syntaxe napříč jazyky) 2013-2016 FP7-ICT-2013-10-610516 (QTLeap) 2014-2016 GAUK 20582/2014 (Adaptivní generátor přirozeného jazyka) 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Moses je dobře známý reprezentant rodiny frázových systémů statistického strojového překladu, který je známý tím, že je extrémně chudý na explicitní lingvistické znalosti, a operuje na plochých reprezentacích jazyka, složených jen z tokenů a frází. Na druhé straně, Treex NLP toolkit, který je vysoce lingvisticky motivovaný, operuje na několika vrstvách reprezentace jazyka, bohatých na lingvistické anotace. Jeho hlavní aplikace je TectoMT, hybridní systém strojového překladu s hloubkovým transfrem syntaxe. Nabízíme přehled velkého počtu systémů strojového překladu, sestavených v minulých letech, které různými způsoby kombinují Mosese a Treex/TectoMT.
English abstract Moses is a well-known representative of the phrase-based statistical machine translation systems family, which are known to be extremely poor in explicit linguistic knowledge, operating on flat language representations, consisting only of tokens and phrases. Treex, on the other hand, is a highly linguistically motivated NLP toolkit, operating on several layers of language representation, rich in linguistic annotations. Its main application is TectoMT, a hybrid machine translation system with deep syntax transfer. We review a large number of machine translation systems that have been built over the past years by combining Moses and Treex/TectoMT in various ways.
Specialization computer science ("informatika")
Confidentiality default – not confidential
Open access no
Editor(s)* Jan Hajič; Gertjan van Noord; António Branco
ISBN* 978-80-88132-02-8
Address* Praha, Czechia
Month* October
Venue* University of Lisbon, Faculty of Sciences, Department of Informatics
Institution* ÚFAL MFF UK
Creator: Common Account
Created: 9/30/16 3:38 PM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

presentationpublicpresentation.pdfapplication/pdf
paperpublicdmtw2015_01.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Sat Nov 18 03:57:19 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant