Новый уровень глубокого обучения для роботов

Стартап Osaro пытается научить роботов думать и делать как человек, только в 100 раз быстрее.  

Новая концепция глубокого обучения с подкреплением (deep-reinforcement learning) возникла из метода глубокого обучения, при котором множественные уровни нейронных сетей производят и организуют огромный объем поступающих данных. Оно используется сейчас во многих ведущих системах распознавания изображений, видео, текстов и устной речи Google. Microsoft, IBM Watson.

Глубокое обучение с подкреплением добавляет к этому методу возможность точно классифицировать входящие данные. Такие системы могут самостоятельно обучать себя, снова и снова повторяя одно и то же задание, пока не добьются желаемого. «Сила глубокого обучения с подкреплением в том, что ты можешь поведенческую модель, которую человек не замечал или не собирался вносить в код», — говорит президент Osaro Дерик Придмор.

Однако, обучение робота — долгий процесс. Компьютер DeepMind учился на миллионе видеокадров, но что хорошо для цифровых задач, которые можно выполнить на суперкомпьютере за минуты, то неприемлемо для роботов в реальном времени.

«Робот имеет физическую оболочку, которой требуется время, чтобы переместиться в пространстве, — говорит Придмор. — Если хотите использовать глубокое обучение с подкреплением, чтобы научить робота с нуля поднимать чашку, это займет буквально год или больше».

Для того чтобы ускорить обучение, Osaro взяла пример с людей, обучающихся новым действиям и создала игровую программу, в которой можно наблюдать за человеком, играющим в игры. Затем она использует эти усилия в качестве отправной точки.

Первым применением алгоритма Osaro станет, по всей видимости, сфера массового производства, где роботы смогут в будущем заменить на конвейере высококвалифицированных (и высокооплачиваемых) специалистов.

Сейчас Osaro получает инвестиции в размере 3 млн долларов от таких заинтересованных лиц, как Питер Тиль и Джерри Янг.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости