[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type article
Status published
Language English
Author(s) Mareček, David Žabokrtský, Zdeněk
Title Gibbs Sampling Segmentation of Parallel Dependency Trees for Tree-Based Machine Translation
Czech title Segmentace paralelních závislostních stromů pomocí Gibbsova samplingu pro stromový strojový překlad
Journal The Prague Bulletin of Mathematical Linguistics
Volume 105
Pages range 101-110
Month April
How published print
URL https://ufal.mff.cuni.cz/pbml/105/art-marecek-zabokrtsky.pdf
Supported by 2014-2016 GP14-06548P (Odvození větné struktury bez anotovaných korpusů) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Představujeme nedokončené zaměřená na těžbu překladové páry zdrojové a cílové závislost treelets které mají být použity v systému strojového překládání závislostí na bázi. Představíme nový voze metodu pro paralelní segmentaci stromu na základě vzorků Gibbs. S použitím dat z české, anglické paralelním korpusu, ukážeme, že postup konverguje ke slovníku, který obsahuje poměrně velké treelets; V některých případech se zdá, že segmentace mít zajímavé lingvistické výklady.
English abstract We present a work in progress aimed at extracting translation pairs of source and target dependency treelets to be used in a dependency-based machine translation system. We introduce a novel unsupervised method for parallel tree segmentation based on Gibbs sampling. Using the data from a Czech-English parallel treebank, we show that the procedure converges to a dictionary containing reasonably sized treelets; in some cases, the segmentation seems to have interesting linguistic interpretations.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
DOI 10.1515/pralin-2016-0005
ISSN* 0032-6585
Institution* Univerzita Karlova v Praze
Creator: Common Account
Created: 10/18/16 11:08 AM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Camera-ready paperpublicpaper.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 03:01:52 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant