[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2015
Type in proceedings
Status published
Language English
Author(s) Dušek, Ondřej Jurčíček, Filip
Date 27.7.2015
Title Training a Natural Language Generator From Unaligned Data
Czech title Trénování generátoru přirozeného jazyka s nezarovnanými daty
Proceedings 2015: Stroudsburg, PA, USA: ACL-IJCNLP 2015: Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)
Pages range 451-461
How published online
URL https://aclweb.org/anthology/P/P15/P15-1044.pdf
Supported by 2012-2016 LK11221 (Vývoj metod pro návrh statistických mluvených dialogových systémů) 2014-2016 GAUK 20582/2014 (Adaptivní generátor přirozeného jazyka) 2015 SVV 260 224 (Teoretické základy informatiky a výpočetní lingvistiky) 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Představujeme nový systém pro generování přirozeného jazyka založený na sytaxi, který je možné trénovat z nezarovnaných párů vstupních reprezentací významu a výstupních vět. Dělí se na větný plánovač, který inkrementálně staví hloubkově syntaktické závislostní stromy, a povrchový realizátor. Větný plánovač je založen na A* vyhledávání s perceptronovým rankerem, který používá nové updaty na základě odlišných podstromů a jednoduchý odhad budoucího potenciálu stromů; povrchová realizace je zajištěna pravidlovým systémem z prostředí Treex. První výsledky ukazují, že trénování z nezarovnaných dat je možné, výstupy našeho generátoru jsou většinou plynulé a relevantní.
English abstract We present a novel syntax-based natural language generation system that is trainable from unaligned pairs of input meaning representations and output sentences. It is divided into sentence planning, which incrementally builds deep-syntactic dependency trees, and surface realization. Sentence planner is based on A* search with a perceptron ranker that uses novel differing subtree updates and a simple future promise estimation; surface realization uses a rule-based pipeline from the Treex NLP toolkit. Our first results show that training from unaligned data is feasible, the outputs of our generator are mostly fluent and relevant.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
ISBN* 978-1-941643-72-3
Address* Stroudsburg, PA, USA
Month* July
Venue* China National Convention Center
Publisher* Association for Computational Linguistics
Institution* Association for Computational Linguistics
Creator: Common Account
Created: 6/2/15 10:07 AM
Modifier: Almighty Admin
Modified: 2/8/16 9:52 PM
***

Proceedings versionpublicP15-1044.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Sep 26 11:48:11 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant