МТИ и Google учат ИИ связывать звук, картинку и текст

Если мы хотим, чтобы роботы в будущем помогали нам, необходимо сделать так, чтобы они могли понимать окружающий мир в полном объеме. К примеру, если они слышат лай, то должны представить, что эти звуки издает собака. Обычно исследователи в области искусственного интеллекта рассматривают распознавание звуков, изображений, текста как разные несвязанные задачи. Но представьте, что было бы, если бы люди не могли сопоставить звук с изображением, которое видят перед собой. Именно эта несогласованность — причина того, что современный ИИ еще не может учиться, как человек.

Исследователи из Массачусетского технологического университета и Google решили исправить ситуацию. Они предприняли попытку сделать так, чтобы ИИ мог связывать звук, картинку и текст в единое целое.

Ученые не обучают ИИ чему-то новому, они просто создают для него способ связывания полученной информации. К примеру, беспилотный автомобиль «слышит» звук сирены и связывает это с изображением скорой помощи из своей базы данных. После этого алгоритм должен прийти к выводу, что управляемому им автомобилю нужно перестроиться, чтобы пропустить скорую помощь.

В Ле-Бурже представили электросамолет с запасом хода 965 км

Технологии

Пока искусственный интеллект не очень «сообразителен», однако согласно прогнозам в ближайшие 5 лет он будет стремительно развиваться. Некоторые эксперты полагают, что ИИ сравняется по своим способностям с человеческим мозгом уже к 2029 году.

МТИ и Google учат ИИ связывать звук, картинку и текст

Читайте «Хайтек» в