OpenAI научился играть в Minecraft, просмотрев 70 тысяч часов видео на YouTube

Программисты научили искусственный интеллект OpenAI играть в Minecraft с помощью YouTube. Разработчики разметили только часть видеозаписей, все остальное обучение система провела сама. Процесс обучения подробно описан в блоге компании и в препринте научной публикации, размещенном на сайте arXiv.

Разработчики сообщают, что ИИ научился базовым навыкам, таким как рубка деревьев, изготовление досок и изготовление столов для крафта. Они также наблюдали, как он плавает, охотится, готовит и «прыгает со столба». Более того, освоив базовые навыки система научилась создавать алмазную кирку. Для отработки этого навыка игрокам-людям требуется около 20 мин. и 24 тыс. действий.

Для обучения ИИ команда OpenAI использовала открытые видео: около 70 тыс. часов записей прохождения игры. Чтобы справиться с таким объемом, компания разработала новую стратегию: предварительное обучение с «полуучителем».

Схема обучения. Первый этап — поиск видео для обучения, второй этап обучение нейросети IDM на основе видео, содержащего сведения о движениях мыши и нажатии клавиш, третий этап — разметка видео с помощью IDM и обучение игровой нейросети. Источник: Open AI

На первом этапе исследователи собрали данные от добровольцев: они записывали видео игры, а также нажатия клавиши и движения мыши. На основе этих данных разработчики обучили модель обратной динамики (IDM) определять, какие действия выполняет игрок, основываясь только на видеоданных. После этого IDM самостоятельно «просмотрел» и разметил записи игры, опубликованные на YouTube. Обучение ИИ игре проводится с помощью уже размеченных IDM данных.

Разработчики отмечают, что модель поведенческого клонирования («игрок»), обученная на онлайн-видео, промаркированном IDM, выполняет задачи в Minecraft, которые почти невозможно выполнить с помощью традиционного обучения с подкреплением с нуля. Он учится рубить деревья, чтобы собирать бревна, превращать эти бревна в доски, а затем делать из досок стол для крафта. Эта последовательность занимает у человека, владеющего Minecraft, примерно 50 с или тысячу последовательных игровых действий.

Разработчики также показали, что дополнительная тонкая настройка с помощью наблюдения ИИ за реальным игровым процесом помогает быстро обучить модель более сложным навыкам.

Исследователи отмечают, что Minecraft — это только один из примеров возможного применения новой технологии. В целом предварительное обучение позволяет использовать минимальные ресурсы для приобретения ИИ различных навыков на основе большого объема видеоданных.


Читать далее:

Космический зонд пролетел в 200 км от Меркурия. Посмотрите, что он увидел

Китайский шлем для «чтения мыслей» бьет тревогу, когда человек видит порноконтент

На спутник Юпитера посмотрели в новом свете: что там увидели ученые

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
В каких странах больше боятся замены людей на ИИ, показало исследование
Наука
Мини-землетрясения под ледяным щитом Гренландии могут изменить уровень моря
Наука
Посмотрите, как Blue Ghost летит над обратной стороной Луны
Космос
Польский стартап представил робота с искусственными мышцами и костями
Новости
Ископаемые находки меняют представление об эволюции неандертальцев
Наука
Microsoft представила квантовый чип Majorana 1 «из новой формы материи»
Новости
Посмотрите на огненный дождь в небе: фрагменты ракеты SpaceX упали в Европе
Космос
Жители России смогут наблюдать редкое астрономическое явление в феврале
Космос
Ученые продвинулись на пути к сверхпроводимости при комнатной температуре
Наука
ИИ-лаборант от Google поможет ученым ускорить открытия
Наука
SR Space испытала ключевые элементы метанового двигателя РД-1
Космос
Китайская камера сможет с орбиты различать лица людей на земле
Новости
Названа главная опасность наушников с шумоподавлением
Наука
Крупнейший в мире ИИ-центр обработки данных построят в Южной Корее
Новости
Квантовое доказательство души: ученые зафиксировали активность мозга перед смертью
Наука
Что случится, если через тело пройдет крошечная черная дыра: ученые нашли ответ
Космос
Случайный цифровой сигнал помог решить главную проблему астрономии
Космос
Минцифры уточнило правила включения софта в реестр российского ПО  
Новости
Ученые разглядели уникальный климат на планете в 900 световых годах от Земли
Космос
«Джеймс Уэбб» наблюдал «световое шоу» в центре Млечного Пути
Космос