DeepMind и OpenAI учат ИИ работать сообща с человеком

Общение человека с ИИ – главная тема исследования, опубликованного компанией DeepMind (принадлежит Google) и OpenAI Institute (финансируется Илоном Маском). Ученые предложили способ обеспечения обратной связи компьютера с человеком без помощи заранее прописанного программистами алгоритма, пишет The Verge.

Люди боятся искусственного интеллекта, потому что он может оказаться недружелюбным или даже попробовать стереть человечество с лица Земли. На самом деле опасным ИИ станет, если не давать ему четких указаний, говорят исследователи. Как в той шутке, когда супер-умного робота с кучей возможностей попросили просто сделать скрепки, он все вещи переделал в скрепки и уничтожил в итоге цивилизацию вместе с человеком.

Новый метод обучения ИИ от DeepMind и OpenAI — это вариация «усиленного машинного обучения» (reinforcement learning или RL). Компьютер раз за разом решает одну и ту же задачу, в то время как программисты направляют его с помощью «вознаграждения». В играх — это обычно определенное количество очков. В результате, путем проб и ошибок ИИ обучается самому адекватному способу решения задачи.

Ученые из DeepMind и OpenAI решили упростить этот процесс и вовсе удалить из процесса программиста: компьютеру показывают два варианта выполнения одной и той же задачи и подсказывают, какой из них лучше. Это повторяется раз за разом, пока ИИ не «уяснит», что именно от него хотят. Метод чем-то похож на поход к окулисту, который меняет линзы и спрашивает: «Так лучше видно? А так?».

«К 2100 году человечество расколется на биологические касты»

С помощью нового метода разработчикам удалось научить бот по имени Hopper делать сальто и приземляться на «ноги». Правда, такой способ обучения отнимает много времени. Прежде чем Hopper идеально кувыркнулся, человека попросили оценить его действия 900 раз в течение часа. Бот обучался 70 часов виртуального времени.

По словам исследователя Oxford Robotics Маркуса Вульфмайера, пока гораздо проще, когда программист заранее прописывает в алгоритме, какое именно поведение ожидается от бота при тех или иных вводных. «Но важно сделать обратную связь более эффективной», — говорит Вульфмайер.

Билл Гейтс назвал три самых перспективных сферы для старта карьеры

В будущем ученые планируют применить эту технологию в более сложных алгоритмах, в частности, в 3D-пространствах. DeepMind уже учит ИИ мыслить категориями сравнения, понимать, как связаны между собой предметы, что у них общего, а что их отличает.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости
Российских айтишников обяжут преподавать в вузах: кого это коснется
Новости
Киберспорт в России сегодня: плюсы и минусы разных бизнес-моделей
Мнения
Одинокого дельфина нашли в Балтийском море: он «разговаривает» сам с собой
Наука
Физики обнаружили сразу три формы хаоса
Наука
Российского хакера экстрадировали в США за создание вируса-вымогателя
Новости
Ученые впервые раскрыли форму короны черной дыры
Космос
Названы сроки запуска аналога Apple Pay в России
Новости
В России придумали, как искать телефонных мошенников по голосу
Новости
Лазерную связь в космосе предложили использовать, чтобы фотографировать черные дыры
Космос
Чат-бот Google научили запоминать пользователей
Новости