Финансируемая предпринимателем Илоном Маском исследовательская лаборатория OpenAI объявила о новом достижении. Разработчики компании создали алгоритм на основе имитационного обучения — технологии, с помощью которой робот учится выполнять двигательные действия на одном единственном примере. Человек показывает последовательность движений в виртуальной реальности, а робот претворяет их в реальности.

OpenAI продемонстрировала работу алгоритма на примере роботизированного манипулятора Fetch Robotics. Машина должна была расставить цветные кубики. Используя VR-гарнитуру, сотрудник лаборатории показал, как именно нужно расставлять объекты. Робот, оснащенный зрительной нейросетью, наблюдал за действиями человека в VR. а затем повторил его действия в реальном мире.

Часть процесса основывалась на прежних наработках OpenAI, в том числе на системе обучения ИИ по смоделированным данным с постоянно меняющимися переменными. Для обучения разработчики использовали не реальные фотографии, а графические изображения стола и кубиков с различными фоном, освещением и текстурой. Метод позволяет роботу анализировать данные с камеры, даже если прежде он никогда не видел фотографии объектов и обстановки.

После наблюдения зрительная нейросеть передает собранные сведения имитационной нейросети, которая управляет действиями манипулятора. Система задает определенное действие, исходя из того, что бы сделал человек в такой же ситуации.

В ходе эксперимента цвет кубиков и их расположение менялись, но робот все равно выполнял последовательность действий, при том, что он не видел ни обучающих фотографий, ни видеороликов.

Разработчики хотят обучить ИИ еще быстрее осваивать новые навыки и применять их в непредсказуемой обстановке. «Младенцы рождаются со способностью имитировать действия других людей. Именно повторение за другими позволяет быстро осваивать навыки. Мы хотим, чтобы и роботы учились так же», — цитирует сотрудника OpenAI Джона Тобина The Verge.

«Смыслом жизни бесполезного класса станут компьютерные игры»

Мнения

Надо признать, что в разработке OpenAI по сути нет ничего нового. Недвано ученые из МТИ разработали систему, которая позволяет людям без каких-либо знаний программирования и робототехники обучать роботов выполнять простейшие задачи. Человек обучает робота движениям, используя его 3D-модель. Робот изначально обучен только базовым движениям, но 3D-игра помогает ему совершать новые, ранее не изученные действия.

Основанная Маском OpenAI научила роботов повторять действия человека