OpenAI научился играть в Minecraft, просмотрев 70 тысяч часов видео на YouTube

Программисты научили искусственный интеллект OpenAI играть в Minecraft с помощью YouTube. Разработчики разметили только часть видеозаписей, все остальное обучение система провела сама. Процесс обучения подробно описан в блоге компании и в препринте научной публикации, размещенном на сайте arXiv.

Разработчики сообщают, что ИИ научился базовым навыкам, таким как рубка деревьев, изготовление досок и изготовление столов для крафта. Они также наблюдали, как он плавает, охотится, готовит и «прыгает со столба». Более того, освоив базовые навыки система научилась создавать алмазную кирку. Для отработки этого навыка игрокам-людям требуется около 20 мин. и 24 тыс. действий.

Для обучения ИИ команда OpenAI использовала открытые видео: около 70 тыс. часов записей прохождения игры. Чтобы справиться с таким объемом, компания разработала новую стратегию: предварительное обучение с «полуучителем».

Схема обучения. Первый этап — поиск видео для обучения, второй этап обучение нейросети IDM на основе видео, содержащего сведения о движениях мыши и нажатии клавиш, третий этап — разметка видео с помощью IDM и обучение игровой нейросети. Источник: Open AI

На первом этапе исследователи собрали данные от добровольцев: они записывали видео игры, а также нажатия клавиши и движения мыши. На основе этих данных разработчики обучили модель обратной динамики (IDM) определять, какие действия выполняет игрок, основываясь только на видеоданных. После этого IDM самостоятельно «просмотрел» и разметил записи игры, опубликованные на YouTube. Обучение ИИ игре проводится с помощью уже размеченных IDM данных.

Разработчики отмечают, что модель поведенческого клонирования («игрок»), обученная на онлайн-видео, промаркированном IDM, выполняет задачи в Minecraft, которые почти невозможно выполнить с помощью традиционного обучения с подкреплением с нуля. Он учится рубить деревья, чтобы собирать бревна, превращать эти бревна в доски, а затем делать из досок стол для крафта. Эта последовательность занимает у человека, владеющего Minecraft, примерно 50 с или тысячу последовательных игровых действий.

Разработчики также показали, что дополнительная тонкая настройка с помощью наблюдения ИИ за реальным игровым процесом помогает быстро обучить модель более сложным навыкам.

Исследователи отмечают, что Minecraft — это только один из примеров возможного применения новой технологии. В целом предварительное обучение позволяет использовать минимальные ресурсы для приобретения ИИ различных навыков на основе большого объема видеоданных.


Читать далее:

Космический зонд пролетел в 200 км от Меркурия. Посмотрите, что он увидел

Китайский шлем для «чтения мыслей» бьет тревогу, когда человек видит порноконтент

На спутник Юпитера посмотрели в новом свете: что там увидели ученые

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Телескоп запечатлел столкновение галактик на скорости 3,2 млн км/ч
Космос
Укус вместо укола: создана вакцина от малярии, распространяемая комарами
Наука
Физики определили форму отдельного фотона
Наука
Создатели ChatGPT планируют выпустить собственный браузер
Новости
Плотность промышленных роботов в мире удвоилась за семь лет
Новости
В Гибралтаре нашли «фабрику», на которой неандертальцы варили клей
Наука
Nvidia раскрыла, какие товары компании будут в дефиците и когда
Новости
Посмотрите на первое в истории фото звезды из другой галактики
Космос
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости
Российских айтишников обяжут преподавать в вузах: кого это коснется
Новости
Киберспорт в России сегодня: плюсы и минусы разных бизнес-моделей
Мнения