[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type article
Status published
Language English
Author(s) Helcl, Jindřich Libovický, Jindřich
Title Neural Monkey: An Open-source Tool for Sequence Learning
Czech title Neural Monkey: Open source nástroj pro sekvenční učení
Journal The Prague Bulletin of Mathematical Linguistics
Publisher's city and country Prague, Czech Republic
Number 107
Pages range 5-17
Supported by 2015-2017 GAUK 52315/2014 (Využití lingvistické informace při extrakci textu z obrazu) 2012-2018 GBP103/12/G084 (Centrum pro multi-modální interpretaci dat velkého rozsahu) 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2015-2018 H2020-ICT-2014-1-645452 (QT21: Quality Translation 21) 2015-2017 H2020-ICT-2014-1-644753 (KConnect (Khresmoi Multilingual Medical Text Analysis, Search and Machine Translation Connected in a Thriving Data-Value Chain))
Czech abstract V tomto článku představujeme vývoj Neural Monkey — open source nástroj pro neuronový strojový překlad a sekvenční učení obecně, který je postavený na knihovně TensorFlow. Náš nástroj poskytuje svým uživatelům vysokoúrovňové rozhraní, které umožňuje rychlé vytváření prototypů komplexních modelů s několika enkodéry a dekodéry. Architektura modelů se vytváří pomocí snadno čitelných konfiguračních souborů. Dlouhodobým cílem Neural Monkey je vytvořit a udržovat kolekci moderních metod pro sekvenční učení. Tomu odpovídá i modulární snadno rozšiřitelný design. Natrénované modely je možné použít pro dávkové zpracování dat nebo spustit jako webovou službu. V předkládaném článku popisujeme základní design nástroje a postup, jak spustit trénování jednoduchého překladače.
English abstract In this paper, we announce development of Neural Monkey — an open-source neural machine translation (NMT) and general sequence-to-sequence learning system built over TensorFlow machine learning library. The system provides a high-level API with support for fast prototyping of complex architectures with multiple sequence encoders and decoders. These models’ overall architecture is specified in easy-to-read configuration files. The long-term goal of Neural Monkey project is to create and maintain a growing collection of implementations of recently proposed components or methods, and therefore it is designed to be easily extensible. The trained models can be deployed either for batch data processing or as a web service. In the presented paper, we describe the design of the system and introduce the reader to running experiments using Neural Monkey.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access yes
DOI 10.1515/pralin-2017-0001
ISSN* 0032-6585
Institution* Univerzita Karlova v Praze
Creator: Common Account
Created: 8/5/16 12:10 PM
Modifier: Common Account
Modified: 6/19/17 2:35 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Thu Nov 23 08:41:12 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant