[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type article
Status published
Language English
Author(s) Mírovský, Jiří Synková, Pavlína Rysová, Magdaléna Poláková, Lucie
Title CzeDLex – A Lexicon of Czech Discourse Connectives
Czech title CzeDLex – slovník českých diskurzních konektorů
Journal The Prague Bulletin of Mathematical Linguistics
Publisher's city and country Prague, Czech Republic
Number 109
Pages range 61-91
Month October
How published print
URL https://ufal.mff.cuni.cz/pbml/109
Supported by 2015-2017 LD15052 (TextLink-cz: Skladba diskurzu v evropských jazycích) 2017-2019 GA17-06123S (Anaphoricity in Connectives: Lexical Description and Bilingual Corpus Analysis) 2017-2019 CZ.02.1.01/0.0/0.0/16_013/0001781 (OP VVV VI LINDAT) 2017-2021 PROGRES Q48 (Informatika)
Czech abstract CzeDLex je nový elektronický slovník českých diskurzních konektorů. Jeho formát a struktura jsou založeny na studiu obdobných existujících zdrojů a upraveny podle české syntaktické tradice a specifik pražského přístupu k anotaci diskurzních vztahů v textu. Nejprve uvádíme slovník do kontextu podobných zdrojů a probíráme teoretické otázky vytváření slovníku. Poté představujeme technické řešení založené na Prague Markup Language. Následně popisujeme proces získání dat pro slovník z velkého korpusu s ručně anotovanými diskurzními vztahy.
English abstract CzeDLex is a new electronic lexicon of Czech discourse connectives. Its data format and structure are based on a study of similar existing resources, and adjusted to comply with the Czech syntactic tradition and specifics and with the Prague approach to the annotation of semantic discourse relations in text. We first put the lexicon in context of related resources and discuss theoretical aspects of building the lexicon. Second, we introduce the chosen technical solution based on the Prague Markup Language. Third, we describe the process of getting data for the lexicon by exploiting a large corpus manually annotated with discourse relations.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access yes
DOI 10.1515/pralin-2017-0039
ISSN* 0032-6585
Institution* Univerzita Karlova v Praze
Creator: Common Account
Created: 8/29/17 2:57 PM
Modifier: Common Account
Modified: 8/30/17 9:40 AM
***

the articlepublic2017_PBML_CzeDLex_final.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Thu Nov 23 08:41:48 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant