DeepMind и OpenAI учат ИИ работать сообща с человеком

Общение человека с ИИ – главная тема исследования, опубликованного компанией DeepMind (принадлежит Google) и OpenAI Institute (финансируется Илоном Маском). Ученые предложили способ обеспечения обратной связи компьютера с человеком без помощи заранее прописанного программистами алгоритма, пишет The Verge.

Люди боятся искусственного интеллекта, потому что он может оказаться недружелюбным или даже попробовать стереть человечество с лица Земли. На самом деле опасным ИИ станет, если не давать ему четких указаний, говорят исследователи. Как в той шутке, когда супер-умного робота с кучей возможностей попросили просто сделать скрепки, он все вещи переделал в скрепки и уничтожил в итоге цивилизацию вместе с человеком.

Новый метод обучения ИИ от DeepMind и OpenAI — это вариация «усиленного машинного обучения» (reinforcement learning или RL). Компьютер раз за разом решает одну и ту же задачу, в то время как программисты направляют его с помощью «вознаграждения». В играх — это обычно определенное количество очков. В результате, путем проб и ошибок ИИ обучается самому адекватному способу решения задачи.

Ученые из DeepMind и OpenAI решили упростить этот процесс и вовсе удалить из процесса программиста: компьютеру показывают два варианта выполнения одной и той же задачи и подсказывают, какой из них лучше. Это повторяется раз за разом, пока ИИ не «уяснит», что именно от него хотят. Метод чем-то похож на поход к окулисту, который меняет линзы и спрашивает: «Так лучше видно? А так?».

«К 2100 году человечество расколется на биологические касты»

С помощью нового метода разработчикам удалось научить бот по имени Hopper делать сальто и приземляться на «ноги». Правда, такой способ обучения отнимает много времени. Прежде чем Hopper идеально кувыркнулся, человека попросили оценить его действия 900 раз в течение часа. Бот обучался 70 часов виртуального времени.

По словам исследователя Oxford Robotics Маркуса Вульфмайера, пока гораздо проще, когда программист заранее прописывает в алгоритме, какое именно поведение ожидается от бота при тех или иных вводных. «Но важно сделать обратную связь более эффективной», — говорит Вульфмайер.

Билл Гейтс назвал три самых перспективных сферы для старта карьеры

В будущем ученые планируют применить эту технологию в более сложных алгоритмах, в частности, в 3D-пространствах. DeepMind уже учит ИИ мыслить категориями сравнения, понимать, как связаны между собой предметы, что у них общего, а что их отличает.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Утечка данных зафиксирована у «Ростелекома»: первый комментарий компании
Новости
Впервые ученым удалось обнаружить квантовое состояние материи: это заняло 20 лет 
Наука
Трамп пообещал «захватить» Марс: президент озвучил планы США
Космос
Названы побочные эффекты популярных препаратов для похудения
Наука
Запрет TikTok: что происходит прямо сейчас, ответ Трампа и Китая, три варианта будущего соцсети
Кейсы
Исследователи объяснили загадочные различия двух полушарий Марса
Космос
Парализованный мужчина научился управлять дроном силой мысли
Наука
Групповой поход в туалет оказался древней социальной привычкой приматов
Наука
Роботизированный экзоскелет помогает пианистам играть быстрее
Новости
Китайские космонавты впервые произвели кислород и топливо на орбите
Космос
«Остров-призрак» в Каспийском море показали из космоса
Космос
Астрофизики придумали, как узнать прошлое невидимых черных дыр
Космос
Мозговой имплант с ультразвуком испытают для лечения депрессии
Наука
В Китае пройдет марафон, в котором будут соревноваться роботы и люди
Новости
Технология «омоложения клеток» продлила жизнь стареющим мышам
Наука
Исследование: 3,5 млн лет назад предки людей были вегетарианцами
Наука
Метеорит впервые зафиксировали на видео и со звуком удара о землю
Новости
Россияне жалуются на сбои в работе eSIM и SIM-карт в iPhone: что происходит
Новости
Ученые обнаружили новый тип планет: как они устроены
Новости
Названа самая частая причина «развода» пингвинов
Новости