Специалисты Калифорнийского университета в Беркли разработали для ИИ «модель врожденной любознательности», которая справляется с задачей в тех случаях, когда обучение с подкреплением не дает желаемых результатов.
Искусственный интеллект, оснащенный некой цифровой формой любознательности, способен улучшить самые мощные современные алгоритмы машинного обучения и приспособить их к решению насущных проблем. ИИ, созданный командой калифорнийских ученых, на примере видеоигры учится максимально полно разбираться в виртуальной реальности.
Один из основных методов машинного обучения — обучение с подкреплением — использует принцип положительного закрепления для формирования стереотипов поведения алгоритма. Этот метод, например, применялся при создании знаменитой AlphaGo — программы, победившей человека в чемпионате по игре в го. Однако, у обучения с подкреплением есть и ограничения. Часто машине требуется очень много времени на то, чтобы чему-то научиться, и процесс затрудняется, если требуемый отклик невозможно дать незамедлительно. Например, в компьютерных играх, в которых вознаграждение за действие наступает не сразу или выражено в неочевидной форме. Тут и может помочь любопытство.
Билл Гейтс назвал три самых перспективных сферы для старта карьеры
Технологии
В эксперименте, проведенном на основе двух классических игр, Mario Bros. и VizDoom, искусственная любознательность ускорила процесс обучения. Даже без награды ИИ научился перемещаться по трехмерным лабиринтам и избегать опасностей, поскольку эти умения позволяют удовлетворить любопытство в исследовании мира игры, сообщает MIT Technology Review.
«В реальном мире вознаграждение бывает далеко не всегда, — говорит Пулкит Агравал, один из авторов исследования. — Дети постоянно пробуют что-то новое, и это тоже разновидность любопытства. Так они учатся новым навыкам».
«Смыслом жизни бесполезного класса станут компьютерные игры»
Мнения
На конференции Google I/O глава компании Сундар Пичаи представил новую технологию AutoML. Это разновидность обучения с подкреплением, но вместо картинок с лицами или машинами компьютеру «скармливают» нейронные сети, и он должен определить, какая из них самая умная. Так ИИ сможет выращивать новые, более мощные ИИ.