OpenAI научился играть в Minecraft, просмотрев 70 тысяч часов видео на YouTube

Программисты научили искусственный интеллект OpenAI играть в Minecraft с помощью YouTube. Разработчики разметили только часть видеозаписей, все остальное обучение система провела сама. Процесс обучения подробно описан в блоге компании и в препринте научной публикации, размещенном на сайте arXiv.

Разработчики сообщают, что ИИ научился базовым навыкам, таким как рубка деревьев, изготовление досок и изготовление столов для крафта. Они также наблюдали, как он плавает, охотится, готовит и «прыгает со столба». Более того, освоив базовые навыки система научилась создавать алмазную кирку. Для отработки этого навыка игрокам-людям требуется около 20 мин. и 24 тыс. действий.

Для обучения ИИ команда OpenAI использовала открытые видео: около 70 тыс. часов записей прохождения игры. Чтобы справиться с таким объемом, компания разработала новую стратегию: предварительное обучение с «полуучителем».

Схема обучения. Первый этап — поиск видео для обучения, второй этап обучение нейросети IDM на основе видео, содержащего сведения о движениях мыши и нажатии клавиш, третий этап — разметка видео с помощью IDM и обучение игровой нейросети. Источник: Open AI

На первом этапе исследователи собрали данные от добровольцев: они записывали видео игры, а также нажатия клавиши и движения мыши. На основе этих данных разработчики обучили модель обратной динамики (IDM) определять, какие действия выполняет игрок, основываясь только на видеоданных. После этого IDM самостоятельно «просмотрел» и разметил записи игры, опубликованные на YouTube. Обучение ИИ игре проводится с помощью уже размеченных IDM данных.

Разработчики отмечают, что модель поведенческого клонирования («игрок»), обученная на онлайн-видео, промаркированном IDM, выполняет задачи в Minecraft, которые почти невозможно выполнить с помощью традиционного обучения с подкреплением с нуля. Он учится рубить деревья, чтобы собирать бревна, превращать эти бревна в доски, а затем делать из досок стол для крафта. Эта последовательность занимает у человека, владеющего Minecraft, примерно 50 с или тысячу последовательных игровых действий.

Разработчики также показали, что дополнительная тонкая настройка с помощью наблюдения ИИ за реальным игровым процесом помогает быстро обучить модель более сложным навыкам.

Исследователи отмечают, что Minecraft — это только один из примеров возможного применения новой технологии. В целом предварительное обучение позволяет использовать минимальные ресурсы для приобретения ИИ различных навыков на основе большого объема видеоданных.


Читать далее:

Космический зонд пролетел в 200 км от Меркурия. Посмотрите, что он увидел

Китайский шлем для «чтения мыслей» бьет тревогу, когда человек видит порноконтент

На спутник Юпитера посмотрели в новом свете: что там увидели ученые

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
На спутнике Сатурна обнаружили аномалию: реки Титана не образуют дельт
Космос
Марсоход обнаружил крупные углеродные отложения на Марсе
Космос
Посмотрите на детальные 3D-модели остатков от взрывов сверхновых
Космос
Крошечные спутники НАСА наблюдали солнечную корону и солнечный ветер
Космос
Хирурги провели пересадку, при которой сердце не переставало биться
Наука
Найдены странные материалы, которые нарушают законы термодинамики
Наука
VR-приложение для снижения тревожности сделали студенты из Чечни
Наука
1 Гб за 3 секунды: китайцы представили флеш-память, которая быстрее оперативки
Новости
Уничтожать нельзя оставить: в России придумали, что делать с борщевиком
Наука
На этой планете нашли признаки жизни: теперь мы знаем, как она выглядит
Космос
Мошенники стали использовать символы Пасхи в схемах в Telegram: как защитить себя
Новости
Китай вывел на максимум экспериментальный ториевый реактор: США это не удалось
Наука
Discord вводит проверку пользователей с помощью биометрии: как это будет работать
Новости
«Солнцезащитный крем» и одежда могли помочь Homo sapiens пережить неандертальцев
Наука
Эта частица раскроет тайну невидимой Вселенной: физики впервые создали ее аналог 
Космос
Климатические аномалии помогли варварам завоевать римскую Британию
Наука
Ответ найден: как крокодилам удалось пережить два массовых вымирания
Наука
Оказалось, кошки не такие уж древние, как все считали
Наука
Терапия стволовыми клетками уменьшила тремор у пациентов с Паркинсоном
Наука
Неуловимый гигантский кальмар впервые попал на видео в естественной среде
Наука