Российские ученые создали платформу для контекстного обучения с подкреплением  

Платформа XLand-MiniGrid позволяет моделировать сложные задачи и мгновенно менять условия обучения. Ученые говорят, что это ускорит создание адаптивных ИИ-алгоритмов и откроет новые возможности в персонализированных рекомендациях, робототехнике и автономном транспорте, сообщили в представители пресс-служб Университета Иннополис и T-Bank AI Research.

Исследователи Университета Иннополис, T-Bank AI Research и AIRI разработали XLand-MiniGrid — открытую виртуальную среду для исследований в области контекстного обучения с подкреплением (In-Context RL). Это направление искусственного интеллекта помогает моделям быстрее адаптироваться к новым задачам, используя подсказки и контекст вместо длительного обучения с нуля. Платформа уже заинтересовала ведущие научные центры, включая Google DeepMind и Оксфордский университет.  

Почему это важно?

Контекстное обучение с подкреплением позволяет искусственному интеллекту быстро реагировать на новые условия и дообучаться в процессе работы. Это особенно полезно для персонализированных рекомендаций, управления роботами и автономных транспортных систем. Однако доступные платформы для таких исследований ограничены. Корпоративные среды, например Google DeepMind, закрыты, а публичные инструменты не подходят для сложных задач.  

XLand-MiniGrid устраняет эти барьеры. Она позволяет моделировать задачи разной сложности, менять условия в реальном времени и использовать готовые датасеты, что упрощает разработку новых алгоритмов.  

Технические особенности

Среду построили на базе JAX — технологии, способной выполнять миллиарды операций в секунду. За счет высокой производительности XLand-MiniGrid собрала более 100 миллиардов примеров поведения ИИ, охватывающих 30 тысяч различных задач. Это позволяет исключить этапы начального обучения, оптимизируя ресурсы и время исследований.  

На графике показано, что XLand-MiniGrid позволяет агентам совершать до 1 трлн взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез. Однако больше половины попыток обучения агентов заканчиваются неудачей. Несмотря на повышение среднего качества агентов, медианное значение остается на нуле, что подчеркивает высокую сложность самой среды для текущего уровня технологий, а значит, может стимулировать их улучшение

Мнение разработчиков

«Когда мы начали работать в этой области, ни одна существующая платформа не подходила для тестирования наших идей. Это стало серьезной проблемой не только для нас, но и для других исследователей. XLand-MiniGrid появился, чтобы закрыть этот пробел», — пояснил Вячеслав Синий из T-Bank AI Research.  

Руководитель группы «Адаптивные агенты» Владислав Куренков добавил, что благодаря разнообразию задач в XLand-MiniGrid можно собирать обширные датасеты и обучать алгоритмы без необходимости начинать с нуля.  

Эксперименты в XLand-MiniGrid уже провели исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Научная статья XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX, описывающая создание среды, была принята на крупнейшую международную конференцию в области искусственного интеллекта — NeurIPS 2024. В этом году конференция пройдет с 10 по 15 декабря в Ванкувере, Канада.

Читать далее:

Сверхзвуковой самолет побил рекорд: всего 3,5 часа полета из Лондона в Нью-Йорк

Анализ 11 млрд лет эволюции Вселенной подтвердил, что Эйнштейн был прав

Ученые нашли новый идеал женской фигуры: дело не в 90-60-90

Обложка: AI | freepik

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Космос
Физики обнаружили доказательство предсказания Хокинга
Космос
Загадочные радиосигналы впервые обнаружили в глубинах Галактики 
Космос
Этот компьютер решил задачу за 20 минут: суперкомпьютер потратил бы миллион лет
Новости
Названа дата удаления домена .su: что будет с 100 000 сайтов
Новости
Google DeepMind дала роботам ИИ: с ним машинам не надо учиться
Новости
Ученые нашли аномалию во Вселенной: эта галактика не должна была выжить
Космос
Астероид Бенну оказался более странным, чем считали ученые
Космос
Сатурн установил рекорд по числу спутников: сколько их теперь у гиганта
Космос
Toyota представила электромобиль, которым можно управлять без прав
Новости
В России придумали, как бороться с нелегальными поставками гаджетов
Новости
Китайский робот освоил езду на велосипеде и работу по дому без предварительного обучения
Новости
У маленьких москвичей будут развивать эмоциональный интеллект
Новости
Частный луноход выжил при посадке, но застрял внутри упавшего модуля
Космос
Инновации будущего: прогноз развития технологий на 100 лет
Мнения
Китайские ученые создали чип без кремния, который на 40% превзошел по скорости Intel
Новости
В космос отправили обсерватории для изучения происхождения Вселенной и солнечного ветра
Космос
Ученые спорят, есть ли на планете рядом с нами жизнь
Космос
Назван продукт, который меняет поведение детей
Наука
Девушка клонировала погибшую собаку за 2 млн рублей — история вызвала споры в соцсетях
Наука