[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2011
Type article
Status published
Language English
Author(s) Bejček, Eduard Straňák, Pavel Zeman, Daniel
Title Influence of Treebank Design on Representation of Multiword Expressions
Czech title Vliv návrhu treebanku na reprezentaci víceslovných výrazů
Journal Lecture Notes in Computer Science
Publisher's city and country BERLIN, GERMANY
Volume 6608
Pages range 1-14
Month February
Note IF (2005): 0,402
How published print
URL http://www.springerlink.com/content/978-3-642-19399-6/#section=855840&page=1&locus=0
Supported by 2005-2010 MSM 0021620838 (Moderní metody, struktury a systémy informatiky) 2011-2013 GAP406/11/1499 (Čeština ve věku strojového překladu) 2005-2009 LC536 (Centrum komputační lingvistiky) 2009-2011 GAUK 1307/2009 (Anotace víceslovných lexémů a pojmenovaných entit v PDT) 2010 SVV 261 314 (Specifický vysokoškolský výzkum)
Czech abstract Víceslovné výrazy (VSV) jsou důležitou lingvistickou jednotkou, která v mnoha aplikacích počítačového zpracování přirozených jazyků vyžaduje zvláštní zacházení. Je proto vhodné, abychom je dokázali rozpoznat automaticky. Sémanticky anotované korpusy by měly vyznačovat VSV jasně a zřetelně, čímž se usnadní vývoj nástrojů pro automatické rozpoznávání.
English abstract Multiword Expressions (MWEs) are important linguistic units that require special treatment in many NLP applications. It is thus desirable to be able to recognize them automatically. Semantically annotated corpora should mark MWEs in a clear way that facilitates development of automatic recognition tools.
In the present paper we discuss various corpus design decisions from this perspective. We propose guidelines that should lead to MWE-friendly annotation and evaluate them on numerous sentence examples. Our experience of identifying MWEs in the Prague Dependency Treebank provides the base for the discussion and examples from other languages are added whenever appropriate.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
WOS Code 000302390500001
DOI 10.1007/978-3-642-19400-9
ISSN* 0302-9743
Publisher* Springer Verlag Heidelberg
Creator: Common Account
Created: 12/11/10 4:49 PM
Modifier: Common Account
Modified: 5/9/16 2:54 AM
***

PDFpublicCAMERA_READY.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Tue Apr 24 10:25:21 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant