[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type article
Status published
Language English
Author(s) Hajič, Jan Hajičová, Eva Mírovský, Jiří Panevová, Jarmila
Title Linguistically Annotated Corpus as an Invaluable Resource for Advancements in Linguistic Research: A Case Study
Czech title Jazykově anotovaný korpus jako důležitý zdroj pro jazykovědný výzkum
Journal The Prague Bulletin of Mathematical Linguistics
Publisher's city and country Prague, Czech Republic
Number 106
Pages range 69-124
Month October
How published print
URL https://ufal.mff.cuni.cz/pbml/106
Supported by 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Případová studie založená na zkušenosti autorů s lingvistickým výzkumem opírajícím se o anotovaný monolingvální I paralelní korpus. Příspěvek zahrnuje popis jevů patřících k různým jazykovým rovinám (morfologie, syntax povrchová I hloubková a diskurs). Podkladem je Pražský závislostní korpus , soubor českých textů komplexně anotovaných na hloubkové syntaktické rovině včetně diskurzních vztahů a informační struktury věty. Autoři ukazují, že anotování (značkování) textových korpusů, pokud je založeno na spolehlivé lingvistické teorii, není účelem samo o sobě, ale že může především sloužit jako dobrý test pro danou teorii i pro jazykovědný výzkum obecně.
English abstract A case study based on experience in linguistic investigations using annotated monolingual and multilingual text corpora; the “cases” include a description of language phenomena belonging to different layers of the language system: morphology, surface and underlying syntax, and discourse; the analysis is based on a complex annotation of syntax, semantic functions, information structure and discourse relations of the Prague Dependency Treebank, a collection of annotated Czech texts. We want to demonstrate that annotation of corpus is not a self-contained goal: in order to be consistent, it should be based on some linguistic theory, and, at the same time, it should serve as a test bed for the given linguistic theory in particular and for linguistic research in general.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
DOI 10.1515/pralin-2016-0012
ISSN* 0032-6585
Institution* Univerzita Karlova v Praze
Creator: Common Account
Created: 10/11/15 9:10 PM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Final versionpublicart-hajic-et-al_final.pdfapplication/download
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 04:50:55 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant