Опубликованная в 1995 году теория британского невролога Дэвида Марра гласит, что обучение — это продукт двух дополняющих систем. Первая система приобретает знания и навыки из опыта и наблюдения, а вторая хранит специфический опыт, чтобы его можно было воспроизвести и успешно интегрировать в первую систему.
Первая система в предложенной теории размещена в неокортексе мозга и напоминает современные нейронные сети. В них есть несколько слоев нейронов, и знание заключается в соединении этих нейронов. Опыт постоянно программирует эти связи узнавать определенные предметы, речь, делать оптимальный выбор.
Когда требуется изучить новую информацию, такие системы встают перед выбором — если сделать слишком большие изменения и слишком быстро, они разрушают уже накопленные знания, пишет Science Daily.
Когнитивные способности ИИ испытали в виртуальном лабиринте
Новости
«Вот где вступает в силу дополнительная система обучения, — говорит профессор Джеймс Макклилланд. — У млекопитающих она расположена в гиппокампе. Сохранив информацию о новом опыте в гиппокампе, мы сделали ее доступной для немедленного использования». Сочетание двух систем позволяет поэтому учиться быстро и структурировать знание, представленное в неокортексе.
Благодаря этим открытиям в теории обучения архитектура нейронных сетей смогла достичь человеческого уровня эффективности в компьютерных играх, таких как Space Invaders или Breakout, говорит Дхаршан Кумаран, главный автор статьи. «Как и в теории, эти нейронные сети используют буфер памяти, похожий на гиппокамп, который хранит последние эпизоды прохождения игры».
По словам второго автора работы, Демиса Хассабиса, «обновленная версия системы обучения с дополнением, скорее всего, останется основой для дальнейших исследований, не только в нейрологии, но и в развитии универсального искусственного интеллекта, к чему мы в Google DeepMind и стремимся».