Новый ИИ может научиться правилам игры по ходу первой же партии

В дочерней компании Google представили систему на основе ИИ, которая учится играть в шахматы или го по ходу первой же партии. Сейчас ученые думают о коммерческом применении модели.

В статье, опубликованной в журнале Science, компания Google подробно описала AlphaZero, систему на основе ИИ, которая может научить себя игры в шахматы и настольную игру Go.  В каждом случае она побеждала чемпиона мира, демонстрируя умение обучаться играм на основе предыдущих матчей.

Но преимущество AlphaZero заключалось в том, что она знала правила игры заранее и могла обучаться до начала матчей. Однако теперь исследователи обновили систему, теперь она способна учиться правилам игры по ходу первой же партии. Модель MuZero предсказывает наиболее релевантные ходы на основе имеющихся на конкретный момент данных. Она с каждым ходом улучшает свои решения.

Модель работает вместе с поиском AlphaZero. Вместо того, чтобы пытаться смоделировать всю среду с помощью алгоритма, MuZero моделирует только те аспекты, которые важны для принятия решения.

Подобных успехов ученые добились благодаря тому, что их программы основываются сразу на двух нейронных сетях — компьютерных алгоритмах, которые имитируют работу цепочек нейронов в мозге человека. Одна из этих нейросетей оценивает текущую позицию игрока на доске, а вторая использует результаты первой сети. Именно она выбирает что делать дальше и ускоряет расчеты.

В течение следующих нескольких месяцев DeepMind планирует сосредоточиться на выявлении потенциальных коммерческих применений MuZero и подобных им систем обучения. Одним из них может стать интернет-трафик. Модель может сжимать видеоклипы и ускорить работу самых крупных видеоплатформ.


Читать далее:

Опасное потепление климата начнется через 7 лет

Аборты и наука: что будет с детьми, которых родят

Посмотрите на самые красивые снимки «Хаббла». Что увидел телескоп за 30 лет?

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Физики придумали, как раскрыть тайну темной материи
Космос
Ученые рассказали, как экстремальный холод влияет на сон
Наука
Марсианский метеорит раскрыл тайны воды на Красной планете
Космос
Хакеры удаленно взломали компьютер, используя соседний Wi-Fi
Новости
«Уэбб» заснял три огромные «невозможные» галактики
Космос
Телескоп запечатлел столкновение галактик на скорости 3,2 млн км/ч
Космос
Укус вместо укола: создана вакцина от малярии, распространяемая комарами
Наука
Физики определили форму отдельного фотона
Наука
Создатели ChatGPT планируют выпустить собственный браузер
Новости
Плотность промышленных роботов в мире удвоилась за семь лет
Новости
В Гибралтаре нашли «фабрику», на которой неандертальцы варили клей
Наука
Nvidia раскрыла, какие товары компании будут в дефиците и когда
Новости
Посмотрите на первое в истории фото звезды из другой галактики
Космос
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии