Новый ИИ может научиться правилам игры по ходу первой же партии

В дочерней компании Google представили систему на основе ИИ, которая учится играть в шахматы или го по ходу первой же партии. Сейчас ученые думают о коммерческом применении модели.

В статье, опубликованной в журнале Science, компания Google подробно описала AlphaZero, систему на основе ИИ, которая может научить себя игры в шахматы и настольную игру Go.  В каждом случае она побеждала чемпиона мира, демонстрируя умение обучаться играм на основе предыдущих матчей.

Но преимущество AlphaZero заключалось в том, что она знала правила игры заранее и могла обучаться до начала матчей. Однако теперь исследователи обновили систему, теперь она способна учиться правилам игры по ходу первой же партии. Модель MuZero предсказывает наиболее релевантные ходы на основе имеющихся на конкретный момент данных. Она с каждым ходом улучшает свои решения.

Модель работает вместе с поиском AlphaZero. Вместо того, чтобы пытаться смоделировать всю среду с помощью алгоритма, MuZero моделирует только те аспекты, которые важны для принятия решения.

Подобных успехов ученые добились благодаря тому, что их программы основываются сразу на двух нейронных сетях — компьютерных алгоритмах, которые имитируют работу цепочек нейронов в мозге человека. Одна из этих нейросетей оценивает текущую позицию игрока на доске, а вторая использует результаты первой сети. Именно она выбирает что делать дальше и ускоряет расчеты.

В течение следующих нескольких месяцев DeepMind планирует сосредоточиться на выявлении потенциальных коммерческих применений MuZero и подобных им систем обучения. Одним из них может стать интернет-трафик. Модель может сжимать видеоклипы и ускорить работу самых крупных видеоплатформ.


Читать далее:

Опасное потепление климата начнется через 7 лет

Аборты и наука: что будет с детьми, которых родят

Посмотрите на самые красивые снимки «Хаббла». Что увидел телескоп за 30 лет?

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найден способ сверхскоростной передачи тепла для быстрого охлаждения электроники
Наука
Условия жизни лошадей в Средневековом Новгороде восстановили по зубам
Наука
Под видом модов для Minecraft и других игр в Telegram распространяют вирусы
Новости
ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
Новости
В России нашли минерал, который поможет изучить ядро Земли и космические тела
Космос
Анализ метеорита поставил под сомнение гипотезу о происхождении воды на Земле
Космос
«Яндекс» научил поиск решать задачи по алгебре для старшеклассников
Новости
Найдена недостающая часть Вселенной: где она скрывалась
Космос
VR в строительстве: как избежать ошибок на сотни миллионов
Мнения
44 планеты, похожие на Землю, нашли в Млечном Пути
Космос
Тайну космоса, которой больше 60 лет, наконец-то раскрыли
Космос
В «дубайском» шоколаде нашли опасные для жизни вещества
Наука
Хакеры атаковали пять оборонных предприятий России
Новости
Как ИИ повышает эффективность и снижает риски обогатительных предприятий
Мнения
«Джеймс Уэбб» изучил загадочные кольца погибшей звезды
Космос
Открыт прием заявок на ежегодную премию Digital Leaders 2025
Новости
GigaChat научился искать информацию в сети: Сбер обновил ИИ-помощника
Новости
Созданы очки с искусственным интеллектом для незрячих людей
Новости
Минобрнауки продолжит программу кешбэка для инвесторов университетских стартапов
Новости
OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов
Новости