Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/101404
Название: SberQuAD – Russian Reading Comprehension Dataset: Description and Analysis
Авторы: Efimov, P.
Chertok, A.
Boytsov, L.
Braslavski, P.
Дата публикации: 2020
Издатель: Springer Science and Business Media Deutschland GmbH
Библиографическое описание: SberQuAD – Russian Reading Comprehension Dataset: Description and Analysis / P. Efimov, A. Chertok, L. Boytsov, et al. — DOI 10.1007/978-3-030-58219-7_1 // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). — 2020. — Vol. 12260 LNCS. — P. 3-15.
Аннотация: The paper presents SberQuAD – a large Russian reading comprehension (RC) dataset created similarly to English SQuAD. SberQuAD contains about 50K question-paragraph-answer triples and is seven times larger compared to the next competitor. We provide its description, thorough analysis, and baseline experimental results. We scrutinized various aspects of the dataset that can have impact on the task performance: question/paragraph similarity, misspellings in questions, answer structure, and question types. We applied five popular RC models to SberQuAD and analyzed their performance. We believe our work makes an important contribution to research in multilingual question answering. © 2020, Springer Nature Switzerland AG.
Ключевые слова: EVALUATION
MULTILINGUAL QUESTION ANSWERING
READING COMPREHENSION
RUSSIAN LANGUAGE RESOURCES
ASSOCIATION REACTIONS
NATURAL LANGUAGE PROCESSING SYSTEMS
QUESTION ANSWERING
QUESTION TYPE
RC MODELS
READING COMPREHENSION
TASK PERFORMANCE
LARGE DATASET
URI: http://elar.urfu.ru/handle/10995/101404
Условия доступа: info:eu-repo/semantics/openAccess
Идентификатор SCOPUS: 85092191483
Идентификатор PURE: 14123133
5932df21-7a79-4285-ae44-5931887a552d
ISSN: 3029743
ISBN: 9783030582180
DOI: 10.1007/978-3-030-58219-7_1
Сведения о поддержке: We thank Peter Romov, Vladimir Suvorov, and Ekaterina Arte-mova (Chernyak) for providing us with details about SberQuAD preparation. We also thank Natasha Murashkina for initial data processing. PB acknowledges support by Ural Mathematical Center under agreement No. 075-02-2020-1537/1 with the Ministry of Science and Higher Education of the Russian Federation.
Располагается в коллекциях:Научные публикации ученых УрФУ, проиндексированные в SCOPUS и WoS CC

Файлы этого ресурса:
Файл Описание РазмерФормат 
2-s2.0-85092191483.pdf322,02 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.