Следующей жертвой алгоритма DeepMind может стать покер

О сокрушительной победе алгоритма AlphaGo со счетом 4:1 в игре с чемпионом го говорят по-прежнему. Но новое исследование из Университетского колледжа Лондона указывает на следующий этап в развитии DeepMind - освоение тактики игры в покер. Об этом пишет The Guardian.

Одним из авторов исследования стал Дэвид Сильвер, преподаватель Университетского колледжа Лондона и один из разработчиков DeepMind. Именно Сильвер был главным программистом алгоритма AlphaGo. В работе под названием «Глубокое подкрепляющее обучение в ходе самостоятельной игры в играх с неполной информацией» описаны методы обучения алгоритма игре в два вида покера: Leduc (максимально упрощенная версия игры с колодой из шести карт) и Texas Hold’em (самый популярный в мире вид).

Используя те же методы, что и при подготовке к играм в го, алгоритм самостоятельно изучил стратегию Texas Hold’em и достиг того же уровня, что и эксперты в этой сфере.

В случае с упрощенным Leduc алгоритм достиг равновесия Нэша — математически оптимальной стратегии игры.

В основе обучения алгоритма лежала методика глубокого обучения с подкреплением, которая базируется на нейросетях. Система училась на своих ошибках и иногда даже играла сама с собой, чтобы лучше изучить игру.

В некоторых аспектах покер — еще более сложная для компьютера игра, чем го, так как машина не знает, что происходит на игровом столе и какие карты на руках у противника. Алгоритм может предсказывать развитие игры, но не может никак разгадать поведение соперника.

Открытие кажется вдвойне значимым, если учесть, что в работе над алгоритмом не принимали участие эксперты и он не обладал никакими программируемыми знаниями о покере.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Управление рисками ИИ в программной инженерии
Мнения
Названы качества идеального партнера: что ценят женщины и мужчины
Новости
Российский алгоритм для анализа белков обогнал зарубежные аналоги по скорости и точности
Новости
России к 2030 году понадобятся миллионы специалистов по ИИ
Новости
Американки массово вшивают «лифчик» прямо в грудь: как работает технология
Новости
Темные фабрики: будущее промышленности без человека
Мнения
Астрономы открыли рекордно далекую от звезды суперземлю
Космос
Датские ученые омолодили стволовые клетки, изменив их «диету»
Наука
Биологи описали стратегии любви у мышей: защищаться или «странствовать»
Наука
Якутские инженеры создали боевого «Скорпиона» для битвы роботов
Новости
Количество DDoS-атак удвоилось в первом квартале 2025 года
Новости
Сдвиг поверхности земли при землетрясении зафиксировали из космоса
Космос
Не так уж жарко: выяснилось, какая погода была на Марсе в прошлом
Космос
Целый океан исчез на Земле: как это изменило историю нашей планеты
Наука
Минцифры запускает эксперимент с ИИ на «Госуслугах»: что он будет делать
Новости
Сжигать жир можно с помощью мыслей: как это работает
Наука
Маркетплейсы превратили шопинг в зависимость: как не потратить свои деньги
Наука
ChatGPT научили материться, как сантехника Валеру из Омска
Новости
Написать научный труд в эпоху нейросетей: как сделать ИИ помощником?
Мнения
Следы «долгожданной» черной дыры нашли в соседней галактике
Космос