Ученые Беркли создали любознательный ИИ

Специалисты Калифорнийского университета в Беркли разработали для ИИ «модель врожденной любознательности», которая справляется с задачей в тех случаях, когда обучение с подкреплением не дает желаемых результатов.

Искусственный интеллект, оснащенный некой цифровой формой любознательности, способен улучшить самые мощные современные алгоритмы машинного обучения и приспособить их к решению насущных проблем. ИИ, созданный командой калифорнийских ученых, на примере видеоигры учится максимально полно разбираться в виртуальной реальности.

Один из основных методов машинного обучения — обучение с подкреплением — использует принцип положительного закрепления для формирования стереотипов поведения алгоритма. Этот метод, например, применялся при создании знаменитой AlphaGo — программы, победившей человека в чемпионате по игре в го. Однако, у обучения с подкреплением есть и ограничения. Часто машине требуется очень много времени на то, чтобы чему-то научиться, и процесс затрудняется, если требуемый отклик невозможно дать незамедлительно. Например, в компьютерных играх, в которых вознаграждение за действие наступает не сразу или выражено в неочевидной форме. Тут и может помочь любопытство.

Билл Гейтс назвал три самых перспективных сферы для старта карьеры

В эксперименте, проведенном на основе двух классических игр, Mario Bros. и VizDoom, искусственная любознательность ускорила процесс обучения. Даже без награды ИИ научился перемещаться по трехмерным лабиринтам и избегать опасностей, поскольку эти умения позволяют удовлетворить любопытство в исследовании мира игры, сообщает MIT Technology Review.

«В реальном мире вознаграждение бывает далеко не всегда, — говорит Пулкит Агравал, один из авторов исследования. — Дети постоянно пробуют что-то новое, и это тоже разновидность любопытства. Так они учатся новым навыкам».

«Смыслом жизни бесполезного класса станут компьютерные игры»

На конференции Google I/O глава компании Сундар Пичаи представил новую технологию AutoML. Это разновидность обучения с подкреплением, но вместо картинок с лицами или машинами компьютеру «скармливают» нейронные сети, и он должен определить, какая из них самая умная. Так ИИ сможет выращивать новые, более мощные ИИ.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости