Следующей жертвой алгоритма DeepMind может стать покер

О сокрушительной победе алгоритма AlphaGo со счетом 4:1 в игре с чемпионом го говорят по-прежнему. Но новое исследование из Университетского колледжа Лондона указывает на следующий этап в развитии DeepMind - освоение тактики игры в покер. Об этом пишет The Guardian.

Одним из авторов исследования стал Дэвид Сильвер, преподаватель Университетского колледжа Лондона и один из разработчиков DeepMind. Именно Сильвер был главным программистом алгоритма AlphaGo. В работе под названием «Глубокое подкрепляющее обучение в ходе самостоятельной игры в играх с неполной информацией» описаны методы обучения алгоритма игре в два вида покера: Leduc (максимально упрощенная версия игры с колодой из шести карт) и Texas Hold’em (самый популярный в мире вид).

Используя те же методы, что и при подготовке к играм в го, алгоритм самостоятельно изучил стратегию Texas Hold’em и достиг того же уровня, что и эксперты в этой сфере.

В случае с упрощенным Leduc алгоритм достиг равновесия Нэша — математически оптимальной стратегии игры.

В основе обучения алгоритма лежала методика глубокого обучения с подкреплением, которая базируется на нейросетях. Система училась на своих ошибках и иногда даже играла сама с собой, чтобы лучше изучить игру.

В некоторых аспектах покер — еще более сложная для компьютера игра, чем го, так как машина не знает, что происходит на игровом столе и какие карты на руках у противника. Алгоритм может предсказывать развитие игры, но не может никак разгадать поведение соперника.

Открытие кажется вдвойне значимым, если учесть, что в работе над алгоритмом не принимали участие эксперты и он не обладал никакими программируемыми знаниями о покере.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Мошенники начали выдавать себя за начальников в рабочих чатах: как это работает
Новости
Холодные атомы этого металла могут создавать новые состояния материи
Наука
Древние артефакты в Украине раскрыли тайны навигации викингов
Наука
Послушайте, как звучат вспышки на Солнце: данные собрал Solar Orbiter  
Космос
Тяжелый беспилотник на водородных топливных ячейках впервые испытали в Китае
Новости
Ученые создали катализатор, который нарушает законы физики
Наука
Физики обнаружили необычные магнитные свойства в трехслойном графене
Наука
Биоинженеры создали ДНК-робота, который может менять форму искусственной клетки
Наука
«Горы» на нейтронных звездах могут вызывать рябь в пространстве-времени
Космос
На телах древних мумий из Перу нашли сложные узоры татуировок
Наука
У черной дыры прячется белый карлик, движущийся с половиной скорости света
Космос
Стартап из России разрабатывает нанопротез для восстановления поврежденных нервов
Наука
Генетики разгадали секреты выживания устойчивой к антибиотикам бактерии
Наука
Астрофизики разгадали тайну космических ускорителей частиц
Космос
Илон Маск: Neuralink поставил мозговой имплант третьему пациенту
Новости
В Китае дроны вызвали снегопад в горах, чтобы решить проблему с недостатком воды
Новости
«Сестра Клеопатры» оказалась римским больным подростком
Наука
2024 год стал самым жарким за полтора века: впервые превышен предел в 1,5°С
Наука
Юпитер оказался не таким, как считали ученые: открытие опровергает гипотезу о гиганте
Космос
Физики придумали, как найти новые измерения в пространстве
Наука