Специалисты МТИ и Google обучают искусственный интеллект связывать звук, картинку и текст в единое целое. Например, алгоритм, управляющий беспилотным автомобилем, сможет распознать сирену, понять, что это скорая помощь и успеть перестроиться, чтобы пропустить ее.
Если мы хотим, чтобы роботы в будущем помогали нам, необходимо сделать так, чтобы они могли понимать окружающий мир в полном объеме. К примеру, если они слышат лай, то должны представить, что эти звуки издает собака. Обычно исследователи в области искусственного интеллекта рассматривают распознавание звуков, изображений, текста как разные несвязанные задачи. Но представьте, что было бы, если бы люди не могли сопоставить звук с изображением, которое видят перед собой. Именно эта несогласованность — причина того, что современный ИИ еще не может учиться, как человек.
Исследователи из Массачусетского технологического университета и Google решили исправить ситуацию. Они предприняли попытку сделать так, чтобы ИИ мог связывать звук, картинку и текст в единое целое.
Ученые не обучают ИИ чему-то новому, они просто создают для него способ связывания полученной информации. К примеру, беспилотный автомобиль «слышит» звук сирены и связывает это с изображением скорой помощи из своей базы данных. После этого алгоритм должен прийти к выводу, что управляемому им автомобилю нужно перестроиться, чтобы пропустить скорую помощь.
В Ле-Бурже представили электросамолет с запасом хода 965 км
Технологии
Пока искусственный интеллект не очень «сообразителен», однако согласно прогнозам в ближайшие 5 лет он будет стремительно развиваться. Некоторые эксперты полагают, что ИИ сравняется по своим способностям с человеческим мозгом уже к 2029 году.