Новости 1 мая 2020

ИИ от Google научился отвечать на прямые вопросы

Далее

ИИ от Google научился отвечать на прямые вопросы, анализируя огромную базу данных компании. В будущем пользователи смогут искать готовые ответы в несколько раз быстрее.

Google планирует внедрить модель машинного обучения с открытым исходным кодом, которая может дать ответ на прямой вопрос, написанный «естественным языком» (например, «президент какой страны правил дольше всего?»). Создатели модели утверждают, что она способна находить ответы, для которых нужно знать информацию сразу о нескольких фактах в разных областях.

Для этого команда хранит огромный массив информации в виде таблиц. Томас Мюллер из Google Research отметил, что для этого есть отдельные базы — к примеру, мировая финансовая статистика и результаты спортивных соревнований хранятся именно в таком виде. Но этим таблицам часто не хватает интуитивно понятного способа их использования — это и есть проблема, которую может решить ИИ.

Чтобы ответить на такие вопросы модель кодирует вопрос, а затем ищет статистику в таблицах. Для каждой ячейки таблицы модель генерирует оценку, указывающую на вероятность того, что информация там станет частью ответа. Кроме того, она выводит вероятность, указывающую, какую операцию надо применить для получения окончательного ответа (например, «AVERAGE», «SUM» или «COUNT»).

Для подготовки модели исследователи дополнительно извлекли из английской «Википедии» 6,2 млн пар табличных материалов, которые служили в качестве учебного набора данных. Во время предварительного обучения модель научилась — с относительно высокой точностью — восстанавливать удаленные слова как в таблицах, так и в тексте. ИИ смог ответить на 71,4% вопросов исследователей. Они уверены, что ее точность в будущем увеличится.