Российские ученые создали платформу для контекстного обучения с подкреплением  

Платформа XLand-MiniGrid позволяет моделировать сложные задачи и мгновенно менять условия обучения. Ученые говорят, что это ускорит создание адаптивных ИИ-алгоритмов и откроет новые возможности в персонализированных рекомендациях, робототехнике и автономном транспорте, сообщили в представители пресс-служб Университета Иннополис и T-Bank AI Research.

Исследователи Университета Иннополис, T-Bank AI Research и AIRI разработали XLand-MiniGrid — открытую виртуальную среду для исследований в области контекстного обучения с подкреплением (In-Context RL). Это направление искусственного интеллекта помогает моделям быстрее адаптироваться к новым задачам, используя подсказки и контекст вместо длительного обучения с нуля. Платформа уже заинтересовала ведущие научные центры, включая Google DeepMind и Оксфордский университет.  

Почему это важно?

Контекстное обучение с подкреплением позволяет искусственному интеллекту быстро реагировать на новые условия и дообучаться в процессе работы. Это особенно полезно для персонализированных рекомендаций, управления роботами и автономных транспортных систем. Однако доступные платформы для таких исследований ограничены. Корпоративные среды, например Google DeepMind, закрыты, а публичные инструменты не подходят для сложных задач.  

XLand-MiniGrid устраняет эти барьеры. Она позволяет моделировать задачи разной сложности, менять условия в реальном времени и использовать готовые датасеты, что упрощает разработку новых алгоритмов.  

Технические особенности

Среду построили на базе JAX — технологии, способной выполнять миллиарды операций в секунду. За счет высокой производительности XLand-MiniGrid собрала более 100 миллиардов примеров поведения ИИ, охватывающих 30 тысяч различных задач. Это позволяет исключить этапы начального обучения, оптимизируя ресурсы и время исследований.  

На графике показано, что XLand-MiniGrid позволяет агентам совершать до 1 трлн взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез. Однако больше половины попыток обучения агентов заканчиваются неудачей. Несмотря на повышение среднего качества агентов, медианное значение остается на нуле, что подчеркивает высокую сложность самой среды для текущего уровня технологий, а значит, может стимулировать их улучшение

Мнение разработчиков

«Когда мы начали работать в этой области, ни одна существующая платформа не подходила для тестирования наших идей. Это стало серьезной проблемой не только для нас, но и для других исследователей. XLand-MiniGrid появился, чтобы закрыть этот пробел», — пояснил Вячеслав Синий из T-Bank AI Research.  

Руководитель группы «Адаптивные агенты» Владислав Куренков добавил, что благодаря разнообразию задач в XLand-MiniGrid можно собирать обширные датасеты и обучать алгоритмы без необходимости начинать с нуля.  

Эксперименты в XLand-MiniGrid уже провели исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Научная статья XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX, описывающая создание среды, была принята на крупнейшую международную конференцию в области искусственного интеллекта — NeurIPS 2024. В этом году конференция пройдет с 10 по 15 декабря в Ванкувере, Канада.

Читать далее:

Сверхзвуковой самолет побил рекорд: всего 3,5 часа полета из Лондона в Нью-Йорк

Анализ 11 млрд лет эволюции Вселенной подтвердил, что Эйнштейн был прав

Ученые нашли новый идеал женской фигуры: дело не в 90-60-90

Обложка: AI | freepik

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Хирурги впервые удалили опухоль позвоночника через глазницу
Наука
Не только в небе: птерозавры ходили бок о бок с динозаврами, выяснили ученые
Наука
Синтезирована молекула, «которая может заменить кремний в микроэлектронике»
Наука
Меньше вспышек, больше бурь: ученые рассказали об активности Солнца в первые месяцы года
Космос
Находка на Кавказе опровергает теории о примитивности неандертальцев
Наука
Астрономы раскрыли тайну магнитаров: эти звезды заполняют Вселенную золотом
Космос
Антидот от 13 ядовитых змей получили из крови донора, которого укусили 856 раз
Наука
Телескоп «Чандра» наблюдал причину «перелома кости» в центре Млечного Пути
Космос
Оптический транзистор разогнали до 240 ГГц: это основа для компьютеров нового поколения
Новости
Google бросает вызов ChatGPT: в поисковике появилась вкладка с ИИ
Новости
Посмотрите, как рождаются планеты: опубликованы самые четкие изображения в истории
Космос
Рыбы в виртуальной реальности обучают роботов двигаться косяками
Новости
У мертвой звезды нашли самую холодную из известных планет
Космос
После обновления ChatGPT стал подхалимом: OpenAI объяснила, что случилось
Новости
«Википедия» внедрит ИИ: это будет работать и что станет с редакторами
Новости
Поднимет и авианосец: для реактора ИТЭР сделали мощнейший магнит в мире
Наука
Посмотрите на маневренный дрон с крыльями, как у белки-летяги
Новости
Недалеко от Земли нашли странную группу молодых звезд, стремящихся разлететься в разные стороны
Космос
Летучие мыши учатся подслушивать за сексом лягушек, чтобы выбрать добычу
Наука
В МФТИ разработана технология для создания долговечной памяти электронных устройств
Наука