Сообщить об ошибке на сайте
URL
Ошибка
Искусственный интеллект

О сокрушительной победе алгоритма AlphaGo со счетом 4:1 в игре с чемпионом го говорят по-прежнему. Но новое исследование из Университетского колледжа Лондона указывает на следующий этап в развитии DeepMind — освоение тактики игры в покер. Об этом пишет The Guardian.

Одним из авторов исследования стал Дэвид Сильвер, преподаватель Университетского колледжа Лондона и один из разработчиков DeepMind. Именно Сильвер был главным программистом алгоритма AlphaGo. В работе под названием «Глубокое подкрепляющее обучение в ходе самостоятельной игры в играх с неполной информацией» описаны методы обучения алгоритма игре в два вида покера: Leduc (максимально упрощенная версия игры с колодой из шести карт) и Texas Hold’em (самый популярный в мире вид).

Используя те же методы, что и при подготовке к играм в го, алгоритм самостоятельно изучил стратегию Texas Hold’em и достиг того же уровня, что и эксперты в этой сфере.

В случае с упрощенным Leduc алгоритм достиг равновесия Нэша — математически оптимальной стратегии игры.

В основе обучения алгоритма лежала методика глубокого обучения с подкреплением, которая базируется на нейросетях. Система училась на своих ошибках и иногда даже играла сама с собой, чтобы лучше изучить игру.

В некоторых аспектах покер — еще более сложная для компьютера игра, чем го, так как машина не знает, что происходит на игровом столе и какие карты на руках у противника. Алгоритм может предсказывать развитие игры, но не может никак разгадать поведение соперника.

Открытие кажется вдвойне значимым, если учесть, что в работе над алгоритмом не принимали участие эксперты и он не обладал никакими программируемыми знаниями о покере.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Дмитрий Филатов, Sistema_VC: стартапы — это в первую очередь про людей, а во вторую — про деньги
Мнения
Эра Data Science: как меняется бизнес с приходом big data и новых технологий
Тренды
Народ против транспорта: почему люди недовольны, когда в городах строят новые станции метро
Идеи
Беспилотники против велосипедистов: как безопасные автомобили сделают жизнь людей хуже
Идеи
Кейсы
«Лиза Алерт»: как беспилотники и краудсорсинг помогают искать пропавших людей
SONM: как люди будут зарабатывать на собственных компьютерах с помощью блокчейна
Кейсы
Егор Матешук, ostrovok.ru: проблемы big data можно решить, закидывая пачки денег в топку
Мнения
Художник-граффитист Миша Most: технология — это кисть, которая создает будущее
Мнения
Лунная гонка: как мировые державы собираются присвоить себе спутник Земли
Идеи
Итоги Нобелевской недели. За что дали Нобелевскую премию в 2018 году?
Тренды
Руслан Шагалеев, Иннополис: война между корпорациями и городами ведется за человеческий капитал
Идеи
Кристина Хаверкамп, DENA: цена на электроэнергию должна сильнее коррелировать c погодой: много солнца и ветра — дешево, мало — дорого
Тренды
Тренды
7 лучших книг о технологиях и науке на русском языке, вышедших в 2018 году
Микрореволюция: фермеры с помощью микробов спасут мир от голода
Идеи
Мнения
Александр Тормасов, Университет Иннополис: мозги людей могут быть совершенно не готовы к восприятию новых идей
Одежда, которая поможет миру: костюм-помощник, майка-тренер и носок-няня
Тренды
В ожидании первого удара: как США готовятся к атаке со стороны России и Китая
Тренды
Страшнее метана: какие еще промышленные выбросы разрушают озоновый слой
Тренды
Интеллект большого города: как данные и умные алгоритмы улучшают качество жизни в мегаполисах
Тренды
На защите европейцев: как GDPR стал дырой в бюджете российских ИТ-компаний
Мнения
Игорь Балк, Global Innovation Labs: в XXI веке приватности нет и не будет
Тренды
Deneum: как заниматься холодным ядерным синтезом и бороться с сомнениями ученых
Кейсы
Расист, оружие и предвзятый судья — каким станет искусственный интеллект в будущем
Тренды
На совести информаторов: как громкие скандалы вокруг АНБ, Facebook и Tesla изменили мир
Тренды
NativeOS: нативная реклама в видео без репутационных потерь и терроризма от режиссера короткометражек
Кейсы
Тренды
Тихий убийца: как микропластик вызывает болезни и останавливает репродукцию живых организмов
Гонка для JavaScript-разработчиков: как постоянные обновления мешают работе
Тренды
Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные
Тренды
Николь Миллс, Booking.com — об инновациях, agile-подходе и индустрии впечатлений
Кейсы
Слишком опасный нанопластик: как одноразовые пакеты превращаются в частицы-убийцы
Тренды
Идеи
Человек и квантовая теория: существует ли то, что мы не наблюдаем
Здесь может быть ваша реклама: НАСА планирует заработать на космосе миллионы
Тренды
Опасный криптотрейдинг: как киберпреступники угрожают виртуальным сбережениям и биржам
Тренды
Как через 20 лет будет выглядеть армия будущего
Тренды
5 финансовых инструментов, которые помогут инвесторам даже после падения криптовалюты
Тренды
Александр Лямин, Qrator Labs: наша задача — выработать у людей цифровую гигиену, чтобы они «не ели с помойки»
Кейсы
Эдуард Фош Вильяронга: люди видят в роботе только внешность, забывая, что он следит за ними
Тренды
Доктор Куэй Во-Райнард, HIT Foundation: если страна требует суверенитета данных, мы построим для нее отдельный блокчейн
Кейсы
Роботы против мигрантов: какой вклад в ксенофобию и расизм делают технологии ИИ
Тренды
Идеи
«Хакинтош»: как собрать свой собственный Mac лучше, чем у Apple
Война скриптов — искусственный интеллект против навязчивой рекламы
Тренды
Как заново изобрести супермаркет: осознанность потребления, этика производства и роботы
Тренды
Каждый человек станет сам себе банком: цифровой мир отказывается от посредников между бизнесом и клиентом
Тренды
Архитектор вычислительной инфраструктуры «Платона» Александр Варламов — о будущем ИТ-индустрии в России, стартапах и разработке
Кейсы
Дмитрий Богданов, капитан сборной России по CS:GO — о стиле жизни киберспортсмена, тренировках и блокировках РКН
Тренды
Прайсинг, трекинг, скоринг, биллинг и другие технологии, которые двигают российский бизнес
Тренды
Идеи
Космос — наш дом: что осталось решить ученым, чтобы поселить человека за пределами Земли
«Педиатр 24/7»: как телемед-стартап подарил родителям спокойствие, а врачам — работу
Кейсы
Вас снова обманули: как человечество учит компьютеры определять фейки в интернете
Тренды