В новом исследовании британской лаборатории DeepMind описано применение обучения с подкреплением для подготовки алгоритма к «паркуру». Компания опубликовала видеоролик, в котором трехмерный человечек под управлением ИИ преодолевает препятствия — перепрыгивает пропасти, преодолевает заборы и пригибается под перекладинами.

Компьютер самостоятельно выбирает оптимальную траекторию движения, используя виртуальные датчики. Они подсказывают, какое положение в пространстве занимает трехмерная фигурка и помогают подобрать подходящие позы и движения. Понимание, как именно нужно двигаться, приходит к ИИ методом проб и ошибок.

В результате, алгоритм показал изобретательность и практически с нуля освоил «паркур». Например, фигурка научилась закидывать колено, чтобы перебраться через препятствие.

К движению фигурку стимулировала система виртуальных вознаграждений. Чем быстрее ИИ преодолевал препятствия на пути из пункта А в пункт Б, тем больше очков он получал. Выполнение задачи без падений вознаграждалось особенно высоко.

RED создала первый в мире смартфон с голографическим дисплеем

Технологии

Недавно DeepMind совместно с лабораторией OpenAI обучила ИИ сообща работать с человеком. С помощью нового метода разработчики научили бот по имени Hopper делать сальто и приземляться на «ноги». При этом алгоритм сам понимал, что от него хотят, сравнивая два варианта выполнения задачи.

ИИ от DeepMind обучился виртуальному паркуру