ИИ от DeepMind стал гроссмейстером по игре го за 3 дня

Алгоритм AlphaGo, в свое время, разгромивший чемпионов-людей в го, продолжает эволюционировать, пишет Spectrum. Ученые из DeepMind заявили, что модифицировали старый алгоритм. После этого новая версия без вмешательства программистов за 3 дня подняла свой уровень с нулевого до гроссмейстерского. 

Принадлежащая Google британская компания DeepMind сообщила о создании усовершенствованной версии алгоритма AlpaGo. Того самого, который в прошлом году победил чемпиона мира по игре го Ли Седоля. Обновленный AlphaGo получил приставку Zero и избавился от необходимости в людях. Создатели объясняют, что для победы над Седолем оригинальный алгоритм пришлось «вручную» тренировать несколько месяцев. Ученые скармливали ему гигабайты данных и сами устанавливали важные точки, на которые алгоритм должен ориентироваться во время партий. После этого AlphaGo закреплял результат, играя тысячи тренировочных партий с самим собой.

AlphaGo Zero кардинально отличается от своего прародителя. Разработчики говорят, что ему вообще не нужны никакие подсказки, точки ориентации или месяцы обучения с самим собой. В вопросах обучения мастерству го алгоритм стал автономным. В Google говорят, что он был запущен с нулевым уровнем умений и дошел до мастерства гроссмейстера. За три дня. Без помощи, подсказок и корректировок со стороны людей.

Спустя 72 часа самосовершенствования новый алгоритм выставили против старого. Тут стоит напомнить, что у старого алгоритма возможности для обучения были гораздо шире. Он мог обращаться к базе игр мастеров го, в его наборе была нейронная сеть, которая имитировала их стиль, а вторая нейронная сеть оценивала качество позиций. То есть первый алгоритм обучался, играя тысячи партий с имитациями реальных игроков. При этом его мощности были распределены по разным компьютерам, на которых в общей сложности стояло 48 тензорных процессоров (TPU). У нового алгоритма для обучения была только доска для го, черные и белые камни и одна нейронная сеть. Запущен он был на единственной машине с 4 TPU. Чемпионат проходил по стандартным правилам. AlphaGo Zero выиграл 100 игр из 100.

SpaceX спровоцирует триллионный бум в аэрокосмической отрасли

За год алгоритм превратился из направляемого человеком в полностью самостоятельный. При этом уменьшились необходимые мощности. Конечно игра в го это достаточно специфическое приложение, но мало ли чему еще может научиться ИИ. Если при традиционных вычислениях ИИ становится гроссмейстером за три дня, то что произойдет, когда Google добьется успеха в квантовых вычислениях. Уже сейчас компания считается одним из лидеров квантовой гонки, она проводит испытания 20-кубитного процессора, и готовится представить рабочий 49-кубитный чип. Если ей это удастся, то в гонке ИИ также наступит новая эра.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
В Китае создали гибкого робота, который скручивается в талии на 320°
Новости
Посмотрите, как 5 000 дронов установили рекорд по самому продолжительному шоу
Новости
Черная смерть бушевала в Африке за тысячу лет до Европы, показал анализ мумии
Наука
«Уэбб» рассмотрел самые маленькие астероиды Главного пояса
Космос
Выручка приложений российских e-commerce брендов увеличилась на 57%
Новости
Посмотрите, как робопес встает в стойку на передних лапах и возит людей
Новости
Разлив нефтепродуктов у побережья Анапы показали на снимках из космоса
Космос
Инженеры больших идей: как российская ИТ-компания создает сообщество разработчиков
Технологии
Это не комета и не астероид: необычный объект нашли в Солнечной системе
Космос
Уникальную черную дыру нашли астрономы: у нее странная ориентация
Космос
Посмотрите на зимний Марс: снег совсем не похож на земной  
Космос
ИИ научился создавать тысячи вирусов: их не видят антивирусы
Новости
Автотехнологии будущего, ставшие реальностью
Мнения
Ученые открыли уникальный материал для памяти будущего
Новости
«Черная» Луна: россияне встретят Новый год с редким астрономическим явлением
Космос
Названы сроки запуска российских спутников «Марафон» для интернета вещей
Космос
Роскачество проверит игры и приложения на манипуляции и безопасность
Новости
Власти начнут собирать данные о перемещениях россиян: как и зачем это нужно
Новости
Выяснилось, как отсутствие секса влияет на мужское здоровье
Наука
Физики придумали, как подтвердить «теорию о мироздании»
Космос