[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type in proceedings
Status published
Language English
Author(s) Aghaebrahimian, Ahmad
Title Quora Question Answer Dataset
Czech title Quora Otázka Odpovědět Datových sad
Proceedings 2017: Cham / Heidelberg / New York / Dordrecht / London: TSD 2017: 20th International Conference, TSD 2017 Prague, Czech Republic, August 27–31, 2017 Proceedings
Pages range 66-73
How published print
Supported by 2017 SVV 260 453 (Teoretické základy informatiky a výpočetní lingvistiky) 2016-2019 GAUK 4055/2016 (Spoken Language Understanding in open-domain environment)
Czech abstract Uvádíme zprávu o pokročilejších úkolech při sestavování datových sad otázka odpovědět Quora. Datová sada Quora se skládá z otázek, které jsou položeny na stránkách Quora answering site. Je to jediná datová sada, která poskytuje odpovědi současně na úrovni vět a slov. Otázky v datové sadě jsou navíc autentické, což je mnohem realističtější pro systémy odpovědí na otázky. Testujeme výkonnost nejmodernějšího záznamníku otázek na datové množině a porovnáváme ji s lidskou výkonností, abychom vytvořili horní hranici datové sady.
English abstract We report on a progressing work for compiling Quora question answer dataset. Quora dataset is composed of the questions which are posed in Quora question answering site. It is the only dataset which provides answers in sentence level and word level at the same time. Moreover, the questions in the dataset are authentic which is much more realistic for question answering systems. We test the performance of a state-of-the-art question answering system on the dataset and compare it with human performance to establish an upper bound for the dataset
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Editor(s)* Kamil Ekštein; Václav Matoušek
ISBN* 978-3-319-64205-5
ISSN* 0302-9743
Address* Cham / Heidelberg / New York / Dordrecht / London
Month* August
Publisher* Springer International Publishing
Institution* Masaryk University
Journal* Lecture Notes in Computer Science
Creator: Common Account
Created: 5/18/17 11:02 AM
Modifier: Common Account
Modified: 8/30/17 6:12 AM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Thu Nov 23 08:44:24 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant