[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2013
Type in proceedings
Status published
Language English
Author(s) Bejček, Eduard Straňák, Pavel Pecina, Pavel
Title Syntactic Identification of Occurrences of Multiword Expressions in Text using a Lexicon with Dependency Structures
Czech title Syntaktická identifikace výskytů víceslovných výrazů v textu s pomocí lexikonu se závislostními strukturami
Proceedings 2013: Atlanta, Georgia, USA: NAACL 2013 workshop: The 9th Workshop on Multiword Expressions (MWE 2013)
Pages range 106-115
How published online
URL http://aclweb.org/anthology//W/W13/W13-1016.pdf
Supported by 2012-2018 GBP103/12/G084 (Centrum pro multi-modální interpretaci dat velkého rozsahu) 2010-2013 GAP406/10/0875 (Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu) 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat)
Czech abstract V tomto článku se zabýváme identifikací výskytů víceslovných výrazů z existujícího slovníku v textovém korpusu. Víceslovné výrazy mohou být libovolné délky a přerušeny v povrchovém pořádku slov. Analyzujeme a porovnáváme tři různé přístupy využívající lingvistické analýza na různých rovinách.
English abstract We deal with syntactic identification of occurrences of multiword expression (MWE) from an existing dictionary in a text corpus. The MWEs we identify can be of arbitrary length and can be interrupted in the surface sentence. We analyse and compare three approaches based on linguistic analysis at a varying level, ranging from surface word order to deep syntax. The evaluation is conducted using two corpora: the Prague Dependency Treebank and Czech National Corpus. We use the dictionary of multiword expressions SemLex, that was compiled by annotating the Prague Dependency Treebank and includes deep syntactic dependency trees of all MWEs.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
ISBN* 978-1-937284-47-3
Address* Atlanta, Georgia, USA
Month* June
Publisher* Association for Computational Linguistics
Institution* Association for Computational Linguistics
Creator: Common Account
Created: 11/6/13 3:49 PM
Modifier: Almighty Admin
Modified: 2/26/14 12:22 PM
***

Presentation (original)publicNAACL 2013 - MWE workshop.key.zipapplication/octet-stream
Presentation (PDF)publicNAACL 2013 - MWE workshop.pdfapplication/pdf
paper in proceedingspublicMWE_WS_2013.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Nov 16 11:53:31 CET 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant