[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2012
Type in proceedings
Status published
Language English
Author(s) Hajič, Jan Hajičová, Eva Panevová, Jarmila Sgall, Petr Bojar, Ondřej Cinková, Silvie Fučíková, Eva Mikulová, Marie Pajas, Petr Popelka, Jan Semecký, Jiří Šindlerová, Jana Štěpánek, Jan Toman, Josef Urešová, Zdeňka Žabokrtský, Zdeněk
Title Announcing Prague Czech-English Dependency Treebank 2.0
Czech title Ohlašujeme Pražský česko-anglický závislostní korpus 2.0
Proceedings 2012: İstanbul, Turkey: LREC 2012: Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012)
Pages range 3153-3160
How published online
URL http://www.lrec-conf.org/proceedings/lrec2012/summaries/510.html
Supported by 2005-2009 LC536 (Centrum komputační lingvistiky) 2009-2012 FP7-ICT-2007-3-231720 (EuroMatrix Plus) 2012-2016 PRVOUK P46 (Informatika) 2006-2008 GA405/06/0589 (Tektogramatický popis jazyka pro rozpoznávání mluvené řeči a strojový překlad) 2010-2013 GAP406/10/0875 (Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu)
Czech abstract Představujeme významnou aktualizaci Pražského česko-anglického závistostního korpusu (PCEDT), paralelního korpusu, který je ručně anotován na hloubkové syntaktické rovině.
English abstract We introduce a substantial update of the Prague Czech-English Dependency Treebank, a parallel corpus manually annotated at the deep syntactic layer of linguistic representation. The English part consists of the Wall Street Journal (WSJ) section of the Penn Treebank. The Czech part was translated from the English source sentence by sentence. This paper gives a high level overview of the underlying linguistic theory (the so-called tectogrammatical annotation) with some details of the most important features like valency annotation, ellipsis reconstruction or coreference.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
WOS Code 000323927703035
ISBN* 978-2-9517408-7-7
Address* İstanbul, Turkey
Month* May
Venue* Lütfi Kırdar Convention & Exhibition Centre
Publisher* European Language Resources Association
Creator: Common Account
Created: 6/22/12 12:58 AM
Modifier: Common Account
Modified: 3/19/18 10:56 AM
***

published version of the paperpublic2012-lrec-pcedt.pdfapplication/force-download
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Sep 26 00:02:14 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant