[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type oral presentation *
Status published
Language English
Author(s) Zeman, Daniel
Title Multilingual Parsing from Raw Text to Universal Dependencies. CoNLL 2017 shared task
Czech title Vícejazyčná syntaktická analýza z prostého textu do Universal Dependencies. Společná úloha CoNLL 2017
Institution ÚFAL MFF UK
Publisher's city and country Praha, Czechia
Venue Matematicko-fyzikální fakulta Univerzity Karlovy
Month May
URL http://lectures.ms.mff.cuni.cz/index.php?cat=6
Supported by 2015-2017 GA15-10472S (Morfologicky a syntakticky anotované korpusy mnoha jazyků) 2017-2021 PROGRES Q48 (Informatika)
Czech abstract Shrnu soutěž v parsingu, kterou jsme organizovali toto jaro. 11 let po první soutěžní úloze CoNLL v závislostním parsingu byla ta současná jednou z největších soutěží v historii CoNLL, a to jak co do velikosti a rozmanitosti testovacích dat (81 treebanků, 49 jazyků), tak co do počtu účastníků (přes 50 týmů, 32 odevzdaných systémů). Soutěž se vyznačovala několika novinkami: kompletní analýza od prostého textu až po závislostní stromy, jazyky s nedostatkem dat a předem neznámé jazyky, jednotné anotační schéma pro všechny jazyky, evaluace naslepo na vzdáleném serveru. Výsledky představují kvalitativně novou úroveň stavu poznání pro automatickou závislostní analýzu většiny jazyků včetně češtiny.
English abstract I will summarize the parsing shared task we organized this spring. 11 years after the first CoNLL shared task in dependency parsing, the present one has arguably been one of the largest CoNLL shared tasks ever, both in size and diversity of test data (81 treebanks, 49 languages) and in number of participants (over 50 teams, 32 submissions). There were several novel aspects: end-to-end parsing from raw text, low-resource and surprise languages, unified annotation across languages, blind evaluation on a remote server. The results set the new state of the art for dependency parsing of most languages, including Czech.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Event Seminář ÚFAL
Presentation type in-house seminar/lecture
Open access yes
Creator: Common Account
Created: 7/22/17 5:34 PM
Modifier: Common Account
Modified: 7/22/17 5:34 PM
***

SlidespublicSLIDES.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 02:42:52 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant