Новый алгоритм обучается через вознаграждения

Новый алгоритм обучается решать задачи с помощи системы вознаграждения. Он поможет биологам понять, как мотивация и психическое здоровье влияет на решения человека.

Исследователи отмечают, что им только предстоит выяснить механизмы, которые позволяют животным учиться с помощи системы вознаграждения. Ученые надеются, что если имитировать поведение в рамках развития искусственного интеллекта, то они смогут более детально выяснить и механизмы мозга человека.

DeepMind, дочерняя компания Alphabet’s, предложила новую теорию о механизмах вознаграждения в нашем мозгу. Эта гипотеза, подкрепленная первоначальными экспериментальными выводами, могла бы не только улучшить наше понимание психического здоровья и мотивации, ученые отмечают, что она также могла бы подтвердить нынешнее направление исследований ИИ для создания интеллекта, похожего на человеческий.

Усиливающее обучение учит комплексным, новым задачам через положительные и отрицательные обратные связи. Алгоритм начинает усваивать задание, случайным образом предсказывая, какое действие может принести ему вознаграждение. Затем он совершает действие, наблюдает за реальной наградой и корректирует свое предсказание, основываясь на пределе погрешности.

После миллиарда предположений алгоритм сводит ошибки предсказания к нулю, и в этот момент он точно знает, какие действия нужно предпринять, чтобы максимизировать свою награду и тем самым может эффективно выполнять задания.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Открыт белок, который восстанавливает ДНК, препятствуя старению мозга
Наука
Рассуждающая модель от китайской MiniMax потребляет меньше ресурсов, чем DeepSeek
Новости
Под Волгоградом обнаружили краску, которую использовали неандертальцы
Наука
Человеческую мочу преобразовали в материал для зубных имплантатов
Наука
Инженер-любитель спроектировал eVTOL: он может пролететь более 200 км за три часа
Новости
Из личинок мухи создали антисептик для борьбы с супербактериями
Наука
В мессенджере WhatsApp скоро появится официальная реклама
Новости
По 319 млн рублей выделят на создание центров промышленной робототехники в России
Иннополис
Инженеры создали дрон с рукой, напоминающей хобот слона
Новости
Спутники устроили искусственное затмение для изучения короны Солнца
Космос
На Кузбассе обнаружили останки флоры и фауны эпохи динозавров
Наука
Кудиты вместо кубитов: физики написали инструкцию для создания кудитных квантовых процессоров
Новости
Астрономы нашли «потерянную» половину материи во Вселенной
Космос
Микробы оказались каннибалами: голодные бактерии поедают соседей, чтобы выжить
Наука
Математики прочитают открытые лекции по оптимизации в Университете Иннополис
Иннополис
Solar Orbiter впервые сфотографировал полярную область на Солнце
Космос
Физики смоделировали «создание света из ничего» в вакууме
Наука
«Уэбб» рассмотрел ледяной мир на странной орбите вблизи Солнечной системы
Космос
В Китае человеческие сердца впервые вырастили в эмбрионах свиней
Наука
Астрономы наблюдали рождение гигантского Юпитера в 430 световых годах от Земли
Космос