Необходимо создать алгоритм, который находит ответ на вопрос, в соответствующем тексте из Википедии.
Датасет включает в себя фрагменты статей из Википедии, вопросы к ним, заданные разметчиками, и правильные ответы. Правильным ответом на каждый вопрос является сегмент из соответствующего фрагмента Википедии.
Пример:
Фрагмент:
Тильзи́тский мир — мирный договор, заключённый в период с 13 июня по 25 июня 1807 года в Тильзите между Александром I и Наполеоном после Войны четвёртой коалиции 1806—1807 годов, в которой Россия помогала Пруссии.
Вопрос:
Как назывался договор, подписанный между Россией и Францией в 1807 году после побед Наполеона в кампании 1806-1807 гг.?
Ответ:
Тильзи́тский мир
Для проверки нужно было предоставить json-файл, в котором указан id вопроса и ответ на него.
Качество решения определялось по двум метрикам:
Вам доступно базовое решение от разработчиков задачи и вебинар с его разбором.