Следующей жертвой алгоритма DeepMind может стать покер

О сокрушительной победе алгоритма AlphaGo со счетом 4:1 в игре с чемпионом го говорят по-прежнему. Но новое исследование из Университетского колледжа Лондона указывает на следующий этап в развитии DeepMind - освоение тактики игры в покер. Об этом пишет The Guardian.

Одним из авторов исследования стал Дэвид Сильвер, преподаватель Университетского колледжа Лондона и один из разработчиков DeepMind. Именно Сильвер был главным программистом алгоритма AlphaGo. В работе под названием «Глубокое подкрепляющее обучение в ходе самостоятельной игры в играх с неполной информацией» описаны методы обучения алгоритма игре в два вида покера: Leduc (максимально упрощенная версия игры с колодой из шести карт) и Texas Hold’em (самый популярный в мире вид).

Используя те же методы, что и при подготовке к играм в го, алгоритм самостоятельно изучил стратегию Texas Hold’em и достиг того же уровня, что и эксперты в этой сфере.

В случае с упрощенным Leduc алгоритм достиг равновесия Нэша — математически оптимальной стратегии игры.

В основе обучения алгоритма лежала методика глубокого обучения с подкреплением, которая базируется на нейросетях. Система училась на своих ошибках и иногда даже играла сама с собой, чтобы лучше изучить игру.

В некоторых аспектах покер — еще более сложная для компьютера игра, чем го, так как машина не знает, что происходит на игровом столе и какие карты на руках у противника. Алгоритм может предсказывать развитие игры, но не может никак разгадать поведение соперника.

Открытие кажется вдвойне значимым, если учесть, что в работе над алгоритмом не принимали участие эксперты и он не обладал никакими программируемыми знаниями о покере.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые преодолели одно из ключевых препятствий для термоядерной энергетики
Наука
Телескоп «Джеймс Уэбб» показал детали космической Конской Головы
Космос
Ученые выяснили, как парниковые газы влияют на распространение болезней
COVID-19
Найдены доказательства необычной силы магнитного поля Земли в прошлом
Наука
Посмотрите, как быстро робот-гуманоид управляется с домашними задачами
Новости
Ядро атома впервые возбудили лазером: это открывает сверхточные измерения времени
Наука
Чек-лист: как обеспечить информационную безопасность маркетплейса
Мнения
Экспериментальный лазер передал данные с зонда «Психея» на расстоянии 226 млн километров
Космос
Посмотрите на самое близкое фото обломка ракеты в космосе
Космос
Ученые нашли следы древних ритуалов майя на благословение
Наука
В Китае появились батареи со сверхбыстрой зарядкой для электрокаров: запас хода составляет 1000 км
Новости
Найдены скрытые «дорожки для мертвых»: их обнаружили с помощью лидара
Наука
Беспилотные грузовики Evocargo начинают работу во «Внуково» в рамках эксперимента
Новости
«Человеческие нейронные сети потребляют около 20 Вт, а искусственные — сотни ватт»
Технологии
Ученые считают, что недалеко от Земли есть «живая» планета
Новости
Китай готов к автономным летающим такси: когда будут первые полеты
Новости
Посмотрите на сотни черных «пауков», которые заполонили Марс весной
Космос
Где похоронен Платон: ученые наконец-то нашли ответ
Наука
Почему мужчины умирают в России на 10 лет раньше женщин: в Минздраве назвали причину
Новости
Крошечный и тонкий экран отслеживает активность мозга во время операции
Новости