Google Research заставляет роботов учиться на своих ошибках

Для того чтобы научиться брать предметы руками, ребенок все детство пробует и учится на своих ошибках. У машин нет столько времени, поэтому Google Research собрали несколько роботов-манипуляторов и заставили их целый месяц подбирать предметы разной формы, размера и веса. Инженеры рассказали, почему этот подход можно считать уникальным, и почему 800 000 раз - это только начало.

Успехам в хватании предметов мы обязаны, в частности, зрению. Вещь можно подобрать и не видя ее, но если следить за движением рук, то получается лучше. У роботов есть аналог зрения, обеспечивающий визуальное самоуправление, которое не только повышает точность движений, но и позволяет брать предметы, которые движутся вокруг вас и меняют направление в тот момент, когда вы их хватаете.

Обучение роботов такому навыку — задача сложная, потому что между данными сенсоров и действиями нет обязательной связи, особенно если данные с датчиков поступают постоянно.

Более изобретательный способ — это позволить роботам учиться самостоятельно. Команда ученых Google Research при помощи коллег из X, поставила задачу роботу 7-DoF подбирать предметы в лотке, используя монокулярное визуальное самоуправление и сверточную нейронную сеть (CNN) для предугадывания последствий хвата.

CNN постоянно обучается (поначалу ошибок много, потом их становится меньше), а чтобы ускорить процесс, Google поставила рядом еще 14 роботов. Все они полностью автономны: людям нужно было лишь наполнить лотки предметами и включить питание.

Выполняя задание, робот постоянно предсказывает, наблюдая за действием своей руки, какое следующее действие максимально увеличит эффективность. В результате получается своего рода координация движений между глазом и рукой.

В будущем инженеры Google Research планируют увеличить разнообразие методик обучения, чтобы узнать, насколько более адаптивными может быть их технология.

Наблюдая за примерно 800 000 попытками (около 3000 робото-часов практики), ученые сделали вывод, что у них начинает формироваться реактивное поведение. Роботы оценивают движения своего манипулятора и корректируют его действия в реальном времени.

Также роботы стали проявлять интересные особенности поведения. Например, они отделяли один предмет от других, чтобы легче было его взять. Все эти действия возникли спонтанно, в процессе обучения, а не были запрограммированы.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые предостерегают от создания зеркальных бактерий: они угрожают жизни
Наука
Астрономы наблюдали редкий гамма-всплеск от черной дыры в соседней галактики
Космос
Физики нашли странную частицу: ее масса то возникает, то исчезает
Наука
Генетики выяснили, когда неандертальцы скрещивались с современными людьми
Наука
В Google оценили риски для криптографии с появлением квантового чипа Willow
Новости
На звездах, подобных Солнцу, супервспышки происходят чаще, чем считалось
Космос
Google Play закрывает монетизацию для разработчиков из России
Новости
НАСА установило причины «первой авиакатастрофы на Марсе»
Космос
Университетский стартап из Грозного разработал VR-тренажер для хоккеистов
Новости
Микророботы из гидрогеля уменьшили раковые опухоли у мышей
Наука
Форум по робототехнике для школьников и студентов пройдет в Иннополисе
Иннополис
В пещере «первых Homo sapience Евразии» обнаружили ритуальную комнату
Наука
Эксперты обсудили путь от замещения импорта к технологическому лидерству
Наука
В ранней Вселенной нашли галактику, напоминающую юный Млечный Путь
Космос
Материал с МКС лучше земных аналогов активирует восстановление костей
Космос
Болото вместо степи: выяснили, каким был мост между Евразией и Америкой
Наука
Горбатый кит в поисках партнера пересек три океана и проплыл 13 000 км
Наука
Химики создали суперустойчивые кишечные палочки для промышленности
Наука
В IBM придумали как в пять раз быстрее обучать ИИ и экономить энергию
Новости
«Т-Технологии» бесплатно предоставит разработчикам российские модели ИИ
Новости