Новый алгоритм обучается через вознаграждения

Новый алгоритм обучается решать задачи с помощи системы вознаграждения. Он поможет биологам понять, как мотивация и психическое здоровье влияет на решения человека.

Исследователи отмечают, что им только предстоит выяснить механизмы, которые позволяют животным учиться с помощи системы вознаграждения. Ученые надеются, что если имитировать поведение в рамках развития искусственного интеллекта, то они смогут более детально выяснить и механизмы мозга человека.

DeepMind, дочерняя компания Alphabet’s, предложила новую теорию о механизмах вознаграждения в нашем мозгу. Эта гипотеза, подкрепленная первоначальными экспериментальными выводами, могла бы не только улучшить наше понимание психического здоровья и мотивации, ученые отмечают, что она также могла бы подтвердить нынешнее направление исследований ИИ для создания интеллекта, похожего на человеческий.

Усиливающее обучение учит комплексным, новым задачам через положительные и отрицательные обратные связи. Алгоритм начинает усваивать задание, случайным образом предсказывая, какое действие может принести ему вознаграждение. Затем он совершает действие, наблюдает за реальной наградой и корректирует свое предсказание, основываясь на пределе погрешности.

После миллиарда предположений алгоритм сводит ошибки предсказания к нулю, и в этот момент он точно знает, какие действия нужно предпринять, чтобы максимизировать свою награду и тем самым может эффективно выполнять задания.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
«Фабрику» железного века по производству краски нашли в Израиле: она проработала 500 лет
Наука
В Японии испытали летающие молниеотводы: дроны, которые привлекают молнии
Новости
Шимпанзе впервые попали на видео во время «вечеринки» с алкоголем
Наука
В Госдуме хотят проверять владельцев российских сайтов через Госуслуги
Новости
Физики разработали кубиты с увеличенным временем жизни для квантовых устройств
Наука
Астрономы подтвердили открытие первой «одинокой» черной дыры
Космос
Создан металл, который не теряет прочности при самых экстремальных температурах
Наука
Сколько яиц и кулича можно съесть на Пасху: врачи назвали допустимую норму
Наука
Открыт новый цвет: его невозможно увидеть в обычных условиях
Наука
OpenAI признала, что новые модели o3 и o4-mini стали «галлюцинировать»
Новости
Первый полумарафон с участием роботов-гуманоидов и людей прошел в Китае
Новости
Необычные куличи для космонавтов на орбите приготовили ученые
Космос
На спутнике Сатурна обнаружили аномалию: реки Титана не образуют дельт
Космос
Марсоход обнаружил крупные углеродные отложения на Марсе
Космос
Посмотрите на детальные 3D-модели остатков от взрывов сверхновых
Космос
Крошечные спутники НАСА наблюдали солнечную корону и солнечный ветер
Космос
Хирурги провели пересадку, при которой сердце не переставало биться
Наука
Найдены странные материалы, которые нарушают законы термодинамики
Наука
VR-приложение для снижения тревожности сделали студенты из Чечни
Наука
1 Гб за 3 секунды: китайцы представили флеш-память, которая быстрее оперативки
Новости