[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2013
Type in proceedings
Status published
Language English
Author(s) Popel, Martin Mareček, David Štěpánek, Jan Zeman, Daniel Žabokrtský, Zdeněk
Title Coordination Structures in Dependency Treebanks
Czech title Souřadné struktury v závislostních korpusech
Proceedings 2013: Sofija, Bulgaria: ACL 2013: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics
Pages range 517-527
How published online
URL http://www.aclweb.org/anthology/P/P13/P13-1051.pdf
Supported by 2011-2013 GAP406/11/1499 (Čeština ve věku strojového překladu) 2012-2016 PRVOUK P46 (Informatika) 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2010-2013 GAP406/10/0875 (Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu)
Czech abstract O parataktických syntaktických strukturách je známo, že jejich zachycení pomocí závislostních mechanismů je obtížné, což má bolestivé důsledky jako značné množství chyb v automatické syntaktické analýze, které souvisí s koordinacemi. Jinými slovy, koordinace je nevyřešeným problémem závislostní analýzy přirozených jazyků. Tento článek se snaží vnést trochu světla do této oblasti a přináší systematický přehled různých formálních prostředků vyvinutých k zachycení souřadných struktur. Přinášíme novou taxonomii takových přístupů a aplikujeme ji na treebanky z typologicky rozličné sady 26 jazyků. Dále prezentujeme empirická pozorování, pokud jde o vzájemnou převoditelnost mezi vybranými styly zachycení.
English abstract Paratactic syntactic structures are notoriously difficult to represent in dependency formalisms, which has painful consequences such as high frequency of parsing errors related to coordination. In other words, coordination is a pending problem in dependency analysis of natural languages. This paper tries to shed some light on this area by bringing a systematizing view of various formal means developed for encoding coordination structures. We introduce a novel taxonomy of such approaches and apply it on treebanks across a typologically diverse range of 26 languages. Empirical observations on convertibility between selected styles of representations are shown too.
Specialization computer science ("informatika")
Confidentiality default – not confidential
Open access no
ISBN* 978-1-937284-50-3
Address* Sofija, Bulgaria
Month* August
Publisher* Association for Computational Linguistics
Institution* Bălgarska akademija na naukite
Creator: Common Account
Created: 4/9/13 12:44 PM
Modifier: Almighty Admin
Modified: 2/26/14 12:23 PM
***

Camera ready versionpublicCAMERA_READY.pdfapplication/pdf
Poster SofijapublicPREVIEW.pdfapplication/pdf
Slides ÚFALpublic2013_09_19_coordinations.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Jan 19 18:20:07 CET 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant