[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2010
Type in proceedings
Status published
Language English
Author(s) Straňák, Pavel Štěpánek, Jan
Date 20.1.2010
Title Representing Layered and Structured Data in the CoNLL-ST Format
Czech title Reprezentace strukturovaných dat o více rovinách ve formátu CoNLL-ST
Proceedings 2010: Hong Kong, China: ICGL 2010: Proceedings of the Second International Conference on Global Interoperability for Language Resources
Pages range 143-152
Supported by 2010-2012 GPP406/10/P193 (Nástroje pro revizi a tektogramatickou anotaci českého závislostního korpusu) 2005-2009 1ET201120505 (Od jazyka ke znalostem a sémantickému webu) 2009-2012 FP7-ICT-2007-3-231720 (EuroMatrix Plus) 2009-2011 GAUK 1307/2009 (Anotace víceslovných lexémů a pojmenovaných entit v PDT)
Czech abstract Článek zkoumá datový formát CoNLL ST, jeho vlastnosti a možnosti jeho použití pro komplexní anotace. Tvrdíme, že CoNLL ST se možná navzdory původnímu záměru stal jedním z nejdůležitějších formátů syntakticky anotovaných dat současnosti. Ukazujeme meze tohoto formátu v jeho současné podobě a navrhujeme několik jednoduchých rozšíření, která je posunují dále a činí ho robustnějším a použitelnějším v budoucnosti. Analyzujeme několik lingvistických anotací různé složitosti jako příklady a ukazujeme, jak mohou být účinně reprezentovány ve formátu CoNLL ST.
English abstract In this paper, we investigate the CoNLL Shared Task format, its properties and possibility of its use for complex annotations. We argue that, perhaps despite the original intent, it is one of the most important current formats for syntactically annotated data. We show the limits of the CoNLL-ST data format in its current form and propose several simple enhancements that push those limits further and make the format more robust and future proof. We analyse several different linguistic annotations as examples of varying complexity and show how they can be efficiently stored in the CoNLL-ST format.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Editor(s)* Alex Chengyu Fang; Nancy Ide; Jonathan Webster
ISBN* 978-962-442-323-5
Address* Hong Kong, China
Month* January
Venue* City University of Hong Kong
Institution* City University of Hong Kong
Creator: Common Account
Created: 1/28/10 3:06 PM
Modifier: Almighty Admin
Modified: 2/3/11 11:03 AM
***

Camera Readypublicicgl2010-stranak,stepanek.pdfapplication/pdf
Presentation slidespublicstepanek,stranak.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Tue Jan 24 10:14:25 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant