[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2012
Type in proceedings
Status published
Language English
Author(s) Zeman, Daniel Mareček, David Popel, Martin Ramasamy, Loganathan Štěpánek, Jan Žabokrtský, Zdeněk Hajič, Jan
Date 24.5.2012
Title HamleDT: To Parse or Not to Parse?
Czech title HamleDT: Rozebrat, či nerozebrat?
Proceedings 2012: İstanbul, Turkey: LREC 2012: Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012)
Pages range 2735-2741
How published online
URL http://www.lrec-conf.org/proceedings/lrec2012/summaries/429.html
Supported by 2011-2013 GAP406/11/1499 (Čeština ve věku strojového překladu) 2010-2012 GAUK 116310/2010 (Anglicko-český strojový překlad s využitím hloubkové syntaxe) 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Představujeme HamleDT – harmonizovaný mnohojazyčný závislostní korpus. HamleDT je kolekce existujících závislostních korpusů (nebo do závislostí převedených jiných syntakticky anotovaných korpusů), transformovaných tak, aby odpovídaly jednotnému anotačnímu stylu. Licenční podmínky nám nedovolují dále šířit samotné korpusy, většina z nich je ovšem pro vědecké účely snadno dostupná a my nabízíme software, který tato data převede do normalizované podoby.
English abstract We propose HamleDT – HArmonized Multi-LanguagE Dependency Treebank. HamleDT is a compilation of existing dependency treebanks (or dependency conversions of other treebanks), transformed so that they all conform to the same annotation style. While the license terms prevent us from directly redistributing the corpora, most of them are easily acquirable for research purposes. What we provide instead is the software that normalizes tree structures in the data obtained by the user from their original providers.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
WOS Code 000323927702132
ISBN* 978-2-9517408-7-7
Address* İstanbul, Turkey
Month* May
Venue* Lütfi Kırdar Convention & Exhibition Centre
Publisher* European Language Resources Association
Creator: Common Account
Created: 3/22/12 9:22 AM
Modifier: Common Account
Modified: 3/19/18 3:59 PM
***

Camera-ready paperpublicCAMERA-READY.pdfapplication/pdf
published version of the paperpublic2012_hamledt.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Sat Oct 20 14:10:29 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant