OpenAI научился играть в Minecraft, просмотрев 70 тысяч часов видео на YouTube

Программисты научили искусственный интеллект OpenAI играть в Minecraft с помощью YouTube. Разработчики разметили только часть видеозаписей, все остальное обучение система провела сама. Процесс обучения подробно описан в блоге компании и в препринте научной публикации, размещенном на сайте arXiv.

Разработчики сообщают, что ИИ научился базовым навыкам, таким как рубка деревьев, изготовление досок и изготовление столов для крафта. Они также наблюдали, как он плавает, охотится, готовит и «прыгает со столба». Более того, освоив базовые навыки система научилась создавать алмазную кирку. Для отработки этого навыка игрокам-людям требуется около 20 мин. и 24 тыс. действий.

Для обучения ИИ команда OpenAI использовала открытые видео: около 70 тыс. часов записей прохождения игры. Чтобы справиться с таким объемом, компания разработала новую стратегию: предварительное обучение с «полуучителем».

Схема обучения. Первый этап — поиск видео для обучения, второй этап обучение нейросети IDM на основе видео, содержащего сведения о движениях мыши и нажатии клавиш, третий этап — разметка видео с помощью IDM и обучение игровой нейросети. Источник: Open AI

На первом этапе исследователи собрали данные от добровольцев: они записывали видео игры, а также нажатия клавиши и движения мыши. На основе этих данных разработчики обучили модель обратной динамики (IDM) определять, какие действия выполняет игрок, основываясь только на видеоданных. После этого IDM самостоятельно «просмотрел» и разметил записи игры, опубликованные на YouTube. Обучение ИИ игре проводится с помощью уже размеченных IDM данных.

Разработчики отмечают, что модель поведенческого клонирования («игрок»), обученная на онлайн-видео, промаркированном IDM, выполняет задачи в Minecraft, которые почти невозможно выполнить с помощью традиционного обучения с подкреплением с нуля. Он учится рубить деревья, чтобы собирать бревна, превращать эти бревна в доски, а затем делать из досок стол для крафта. Эта последовательность занимает у человека, владеющего Minecraft, примерно 50 с или тысячу последовательных игровых действий.

Разработчики также показали, что дополнительная тонкая настройка с помощью наблюдения ИИ за реальным игровым процесом помогает быстро обучить модель более сложным навыкам.

Исследователи отмечают, что Minecraft — это только один из примеров возможного применения новой технологии. В целом предварительное обучение позволяет использовать минимальные ресурсы для приобретения ИИ различных навыков на основе большого объема видеоданных.


Читать далее:

Космический зонд пролетел в 200 км от Меркурия. Посмотрите, что он увидел

Китайский шлем для «чтения мыслей» бьет тревогу, когда человек видит порноконтент

На спутник Юпитера посмотрели в новом свете: что там увидели ученые

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос