ИИ от DeepMind стал гроссмейстером по игре го за 3 дня

Алгоритм AlphaGo, в свое время, разгромивший чемпионов-людей в го, продолжает эволюционировать, пишет Spectrum. Ученые из DeepMind заявили, что модифицировали старый алгоритм. После этого новая версия без вмешательства программистов за 3 дня подняла свой уровень с нулевого до гроссмейстерского. 

Принадлежащая Google британская компания DeepMind сообщила о создании усовершенствованной версии алгоритма AlpaGo. Того самого, который в прошлом году победил чемпиона мира по игре го Ли Седоля. Обновленный AlphaGo получил приставку Zero и избавился от необходимости в людях. Создатели объясняют, что для победы над Седолем оригинальный алгоритм пришлось «вручную» тренировать несколько месяцев. Ученые скармливали ему гигабайты данных и сами устанавливали важные точки, на которые алгоритм должен ориентироваться во время партий. После этого AlphaGo закреплял результат, играя тысячи тренировочных партий с самим собой.

AlphaGo Zero кардинально отличается от своего прародителя. Разработчики говорят, что ему вообще не нужны никакие подсказки, точки ориентации или месяцы обучения с самим собой. В вопросах обучения мастерству го алгоритм стал автономным. В Google говорят, что он был запущен с нулевым уровнем умений и дошел до мастерства гроссмейстера. За три дня. Без помощи, подсказок и корректировок со стороны людей.

Спустя 72 часа самосовершенствования новый алгоритм выставили против старого. Тут стоит напомнить, что у старого алгоритма возможности для обучения были гораздо шире. Он мог обращаться к базе игр мастеров го, в его наборе была нейронная сеть, которая имитировала их стиль, а вторая нейронная сеть оценивала качество позиций. То есть первый алгоритм обучался, играя тысячи партий с имитациями реальных игроков. При этом его мощности были распределены по разным компьютерам, на которых в общей сложности стояло 48 тензорных процессоров (TPU). У нового алгоритма для обучения была только доска для го, черные и белые камни и одна нейронная сеть. Запущен он был на единственной машине с 4 TPU. Чемпионат проходил по стандартным правилам. AlphaGo Zero выиграл 100 игр из 100.

SpaceX спровоцирует триллионный бум в аэрокосмической отрасли

За год алгоритм превратился из направляемого человеком в полностью самостоятельный. При этом уменьшились необходимые мощности. Конечно игра в го это достаточно специфическое приложение, но мало ли чему еще может научиться ИИ. Если при традиционных вычислениях ИИ становится гроссмейстером за три дня, то что произойдет, когда Google добьется успеха в квантовых вычислениях. Уже сейчас компания считается одним из лидеров квантовой гонки, она проводит испытания 20-кубитного процессора, и готовится представить рабочий 49-кубитный чип. Если ей это удастся, то в гонке ИИ также наступит новая эра.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Оказалось, Apple Watch «обманывают» в подсчете калорий
Новости
Китай впервые проверил квантовую связь QSDC на борту многоразовой ракеты
Наука
В Москве пройдет форум MOSТИМ 2025 — обсудят цифровизацию в строительстве и выберут лучших в BIM
Новости
Россиянам могут заблокировать входящие звонки из-за рубежа
Новости
Страдающее «лицо» появилось на Солнце: ученые фиксируют поток частиц в сторону Земли
Космос
Маск и Трамп начали войну в соцсетях: что произошло и какие будут последствия
Кейсы
В Нижнем Новгороде создали «умный» материал для 3D-печати человеческих тканей
Наука
ИИ против супербактерий: в ИТМО создали платформу для поиска новых лекарств
Новости
Парк промышленных роботов в России вырос на 62% за один год
Новости
Геофизики объяснили загадочное ускорение сейсмических волн в недрах Земли
Наука
Семь российских вузов разделят 4,7 млрд рублей на исследования в области ИИ
Иннополис
Найден способ изучать квантовые состояния, которые десятилетиями не получалось поймать
Наука
Каталог кейсов применения квантовых технологий представили в России
Новости
Ozempic и мужское здоровье: как препарат влияет на либидо и восприятие размера пениса
Наука
Землю 2.0 нашли рядом со звездой, похожей на Солнце
Космос
Рыбу «Судного дня» случайно нашли в на пляже: почему ее опасаются
Наука
Раскрыта идеальная формула эффективности на работе
Наука
Бесплатные пользователи ChatGPT получат одну из премиальных функций чат-бота: как это работает
Новости
На «Госуслугах» появятся адреса бомбоубежищ: как и где посмотреть
Новости
Китай построит «фабрику элементарных частиц» для поиска темной материи
Наука