Кейсы 31 января 2017

Алгоритм Libratus обыграл людей в покер

Далее

Завершилась серия игр в покер между искусственным интеллектом Libratus и людьми. Программа выиграла у людей фишки на виртуальную сумму $1 766 250. Для профессиональных игроков победа искусственного интеллекта оказалась полной неожиданностью.

Турнир Brains vs Artificial Intelligence («Мозги против искусственного интеллекта») проходил в течение 20 дней. Ежедневно с 11 утра и до 10 вечера четыре профессиональных игрока в покер проводили время в казино Rivers в Питтсбурге, пытаясь обыграть алгоритм Libratus в безлимитный техасский холдем. По словам профессионального игрока Джейсона Лэса, Libratus, созданный учеными из Университета Карнеги-Меллон, превзошел ожидания, а его победа оказала деморализующее воздействие на участников соревнования.

Исход турнира действительно оказался неожиданностью, если учесть, какой неровной была игра. Первую партию человечество проиграло. Алгоритм, отрабатывавший стратегию ведения игры в течение 15 млн часов, выиграл $81 000, а реальные игроки лишь $7 000.

На четвертый день турнира люди стали обыгрывать Libratus. Алгоритм обвинили в отсутствии интуиции и изобретательности, а критики начали ставить на его поражение. Многие вспомнили предшественника Libratus — алгоритм Claudico, также разработанный учеными из Университета Карнеги-Меллон. В 2015 году эта программа проиграла четырем мастерам по игре в покер. По словам Джейсона Лэса, новый алгоритм значительно превосходит своего предшественника.

Секрет успеха Libratus заключается в непрерывной практике и неутомимости. Как сообщает The Guardian, после окончания партий люди готовились к следующей игре и поздно ложились спать, а алгоритм совершенствовал стратегию на суперкомпьютере Bridges всю ночь. Утром бот обновлялся и с новыми знаниями вступал в очередную игру — без усталости и недосыпа.

В прошлом году настоящим прорывом в области искусственного интеллекта стала победа алгоритма AlphaGo от DeepMind над чемпионом по игре в го Ли Седолем. Событие также стало неожиданностью для многих.

В отличие от го и других настольных игр, для покера характерна неполнота информации. Перед игроком нет доски с расстановкой шашек, чтобы выиграть, участникам приходится блефовать. Один из создателей Libratus Ноам Браун подчеркивает, что игра в покер строится не на считывании эмоций противника и угадывании его действий, как думают люди, а на картах и вероятностях. И с этим Libratus легко справляется. Ученый считает, что победа алгоритма позволит избавиться от предубеждений в отношении машинного интеллекта

Маск расскажет о «нейронном кружеве» в феврале

Алгоритмы, подобные Libratus, способны не только обыгрывать людей в азартные игры. Они могут проводить переговоры, составлять стратегию боя или планировать меры по кибербезопасности, а также составлять план лечения. Стратегическое мышление при неполной информационной картине — главное преимущество алгоритмов. При этом некоторые эксперты полагают, что машинный интеллект плохо справляется с задачами в условиях непредсказуемости. Но победа Libratus опровергает этот тезис.