На этой неделе ученые опубликовали сразу несколько исследований, которые рассказывают об экспериментах Alphabet в сфере обучения роботов. Исследователи обучали машины простым задачам, например, открывать двери или толкать небольшие предметы — при помощи «обучения с подкреплением» (от англ. reinforcement learning).
Суть метода состоит в том, что робот выполняет поставленную перед ним задачу разными способами, а затем оценивает результат и на основании этого закрепляет лучший из испробованных им вариантов действий. Однако весь этот процесс может занимать очень долгое время, поэтому ученые Alphabet решили использовать для этих целей облачные технологи, пишет MIT Technology Review.
Ученые случайно изобрели лекарство от рака
Идеи
Они провели серию экспериментов, один из которых заключался в том, что группа из четырех роботов училась открывать двери четырех разных видов (по одному роботу на каждую дверь). Роботы обучались при помощи собственных нейросетей, которые затем синхронизировались с нейросетями других роботов на общем сервере.
В результате, каждый робот научился открывать дверь, которую никогда до этого не видел, рассказывает ведущий исследователь Google в сфере машинного обучения Сергей Левин в статье, опубликованной в блоге компании (написана в соавторстве с двумя исследователями из других дочерних компаний Alphabet — Deep Mind и X).
Ученые записали парадокс кота Шредингера на камеру
Кейсы
Конечно, пока возможности роботов сильно ограничены, однако в будущем технология совместного обучения машин может сыграть значительную роль в их развитии, добавляют авторы статьи. Тем не менее, уже сейчас роботы могут частично заменить человека в таких областях, как охрана территорий, строительство домов и даже медицина.