Искусственный интеллект, в отличие от человека, не обладает «сильным интеллектом», к которому прибегают люди, когда сталкиваются с новыми задачами. Он ограничен в использовании прошлого знания. Но исследования ученых DeepMind показывают, что эту проблему можно решить, если мы когда-нибудь хотим построить машины, которые сравняются с нами.
Способность запоминать старые навыки и применять их к новым задачам, естественная для человека, оказалась серьезным препятствием для ИИ, который обычно умеет выполнять только одну задачу. Так происходит потому, что большинство ИИ работает на основе нейронных сетей, которые учатся, к примеру, играть в шахматы или покер методом проб и ошибок. Но как только ИИ овладел одним навыком, он может научиться другому, только записав его поверх уже изученного. Специалисты называют это «катастрофическим забыванием».
ИИ DeepMind использовал самые основные элементы обучающегося мозга. Прежде чем переходить к следующей задаче, он узнает, какие связи в нейронной сети были наиболее важными для задачи, которую он решал. И закрепляет их, когда изучает новые.
Ученые поставили перед ИИ задачу играть в классические аркады Atari (Breakout, Space Invaders, Defender и др.) в случайном порядке. И обнаружили, что после нескольких дней игры ИИ стал играть на уровне человека в семь из них. Обычным способом ИИ мог едва-едва научиться играть в одну из них, сообщает The Guardian.
«Мы все еще очень далеко от общего искусственного интеллекта и придется решить еще много научных задач, — сказал Джеймс Киркпатрик. — Одна из частей головоломки — как построить систему, которая может изучать новые задачи и навыки, сохраняя способности, которые уже изучила. Это исследование — первый шаг в этом направлении, и со временем поможет нам создать системы, способные к гибкому и эффективному обучению».
В Гонконге изобрели самую энергоэффективную LED-лампу
Технологии
Осенью прошлого года «Хайтек» писал, что DeepMind научила свой ИИ Unreal мечтать — проходя игру Labyrinth, «мысленно» воспроизводит свои прошлые попытки сыграть в игру, уделяя особое внимание удачным моментам, когда системе удалось заработать очки.