[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2008
Type in proceedings without ISBN
Status published
Language English
Author(s) Bejček, Eduard Straňák, Pavel Schlesinger, Pavel
Title Annotation of Multiword Expressions in the Prague Dependency Treebank
Czech title Anotace víceslovných výrazů v Pražském závislostním korpusu
Proceedings 2008: Hyderabad, India: IJCNLP 2008: IJCNLP 2008 Proceedings of the Third International Joint Conference on Natural Language Processing
Pages range 793-798
Supported by 2005-2009 1ET201120505 (Od jazyka ke znalostem a sémantickému webu) 2005-2010 MSM 0021620838 (Moderní metody, struktury a systémy informatiky) 2005-2008 GD201/05/H014 (Collegium Informaticum)
Czech abstract V tomto článku chceme ukázat, že anotace víceslovných výrazů Pražského závislostního korpusu je dobře definovaný úkol, že je potřebný a proveditelný, a že můžeme dosáhnout dobré mezianotátorské shody. Ukážeme způsob, jak měřit shodu pro tento druh anotace. Dále tvrdíme, že určitá automatická předanotace je možná a nepoškozuje výsledky.
English abstract In this article we want to demonstrate that annotation of multiword expressions in the Prague Dependency Treebank is a well defined task, that it is useful as well as feasible, and that we can achieve good consistency of such annotations in terms of inter-annotator agreement. We show a way to measure agreement for this type of annotation. We also argue that some automatic pre-annotation is possible and it does not damage the results.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Address* Hyderabad, India
Month* January
Venue* Indian School of Business
Institution* International Institute of Information Technology
Organization* Asian Federation of Natural Language Processing
Creator: Almighty Admin
Created: 9/30/08 10:31 AM
Modifier: Almighty Admin
Modified: 2/3/11 11:00 AM
***

Annotation of Multiword Expressions in the Prague ...publicI08-2111.pdfapplication/pdf
PosterpublicPoster.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Nov 16 11:42:59 CET 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant