ИИ от DeepMind стал гроссмейстером по игре го за 3 дня

Алгоритм AlphaGo, в свое время, разгромивший чемпионов-людей в го, продолжает эволюционировать, пишет Spectrum. Ученые из DeepMind заявили, что модифицировали старый алгоритм. После этого новая версия без вмешательства программистов за 3 дня подняла свой уровень с нулевого до гроссмейстерского. 

Принадлежащая Google британская компания DeepMind сообщила о создании усовершенствованной версии алгоритма AlpaGo. Того самого, который в прошлом году победил чемпиона мира по игре го Ли Седоля. Обновленный AlphaGo получил приставку Zero и избавился от необходимости в людях. Создатели объясняют, что для победы над Седолем оригинальный алгоритм пришлось «вручную» тренировать несколько месяцев. Ученые скармливали ему гигабайты данных и сами устанавливали важные точки, на которые алгоритм должен ориентироваться во время партий. После этого AlphaGo закреплял результат, играя тысячи тренировочных партий с самим собой.

AlphaGo Zero кардинально отличается от своего прародителя. Разработчики говорят, что ему вообще не нужны никакие подсказки, точки ориентации или месяцы обучения с самим собой. В вопросах обучения мастерству го алгоритм стал автономным. В Google говорят, что он был запущен с нулевым уровнем умений и дошел до мастерства гроссмейстера. За три дня. Без помощи, подсказок и корректировок со стороны людей.

Спустя 72 часа самосовершенствования новый алгоритм выставили против старого. Тут стоит напомнить, что у старого алгоритма возможности для обучения были гораздо шире. Он мог обращаться к базе игр мастеров го, в его наборе была нейронная сеть, которая имитировала их стиль, а вторая нейронная сеть оценивала качество позиций. То есть первый алгоритм обучался, играя тысячи партий с имитациями реальных игроков. При этом его мощности были распределены по разным компьютерам, на которых в общей сложности стояло 48 тензорных процессоров (TPU). У нового алгоритма для обучения была только доска для го, черные и белые камни и одна нейронная сеть. Запущен он был на единственной машине с 4 TPU. Чемпионат проходил по стандартным правилам. AlphaGo Zero выиграл 100 игр из 100.

SpaceX спровоцирует триллионный бум в аэрокосмической отрасли

За год алгоритм превратился из направляемого человеком в полностью самостоятельный. При этом уменьшились необходимые мощности. Конечно игра в го это достаточно специфическое приложение, но мало ли чему еще может научиться ИИ. Если при традиционных вычислениях ИИ становится гроссмейстером за три дня, то что произойдет, когда Google добьется успеха в квантовых вычислениях. Уже сейчас компания считается одним из лидеров квантовой гонки, она проводит испытания 20-кубитного процессора, и готовится представить рабочий 49-кубитный чип. Если ей это удастся, то в гонке ИИ также наступит новая эра.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Врачи пересадили мужчине стволовые клетки для борьбы с бесплодием
Наука
Китайские ученые создали 32-битный процессор толщиной в одну молекулу
Новости
«Пьяные» самцы привлекательнее для самок дрозофил, показало исследование
Наука
Midjourney запустила новый генератор изображений после вирусного обновления ChatGPT
Новости
Самокаты только по биометрии: какие изменения планируют в России
Новости
Студенты разработали приложение для баланса работы и личной жизни
Новости
Неуловимую «обреченную» пару звезд нашли вблизи Солнечной системы
Космос
Как защитить доступ к «Госуслугам» от мошенников: появился новый способ
Новости
«Уэбб» поставил астрономов в тупик: какую аномалию он нашел во Вселенной
Космос
Физики собрали «квантовый сэндвич» из невозможных материалов
Наука
Российский военный спутник выпустил новый объект на орбите: неизвестно, что это
Кейсы
Эта черная дыра поглощает материю и выбрасывает часть еды в космос
Космос
«Уэбб» раскрыл тайну центра Млечного Пути: почему там формируется слишком мало звезд
Космос
Рак распространяется как сеть: российские ученые наблюдали в 3D особенности развития опухолей
Наука
Солнечная буря сдавила магнитное поле Юпитера «как гигантский мяч для сквоша»
Космос
Анализ крови определяет стадию болезни Альцгеймера с точностью 92%: это поможет подобрать терапию
Наука
ИИ впервые прошел тест Тьюринга: GPT-4.5 обманул людей в 73% случаев
Новости
В Сколтехе нашли способ увеличить емкость суперконденсаторов для электромобилей
Наука
ИИ ускорил поиск дефектов трубопроводов в 30 раз
Новости
Под пирамидами Гизы нашли «скрытый город», но с учеными согласны не все
Наука