Собран набор данных, чтобы учить ИИ самостоятельно принимать решения

Опубликован крупнейший общедоступный набор данных для контекстного обучения с подкреплением, сообщает пресс-служба Института искусственного интеллекта AIRI.

Исследователи из российского Института искусственного интеллекта AIRI и лаборатории T-Bank AI Research опубликовали два общедоступных набора данных для контекстного обучения с подкреплением на основе среды XLand-MiniGrid. Упрощенная версия содержит чуть меньше 20 млрд кортежей — упорядоченных наборов данных фиксированной длины, полная — свыше 112 млрд.

Наборы данных валидировали с помощью графиков обучающих историй — траектории были естественным образом упорядочены по возрастанию суммарной награды за эпизод, сообщают разработчики. Они считают, что наборы помогут настраивать ИИ-системы для решения новых задач без вовлечения узкопрофильных специалистов, а также станут источником полезных синтетических данных.

Контекстное обучение с подкреплением (In-Context Reinforcement Learning) сфокусировано на создании моделей, которые хорошо работают не только на тренировочных задачах, но и способны максимально эффективно дообучаться за минимальное время. Например, большинство чат-ботов можно научить новой задаче, добавив в промпт некоторое количество примеров ее решения.

Такие методы подходят, чтобы обучать ИИ принимать решения, объясняют разработчики. ИИ-агент должен исследовать среду (exploration) и понять, какие действия ведут к хорошему исходу, а какие — к плохому. Затем он должен остановиться и перейти в фазу «эксплуатации хороших действий» (exploitation). Задача exploration — exploitation заключается в том, чтобы найти механизм обучения, который на горизонте N шагов обеспечивает наилучший результат за меньшее количество шагов.

В области контекстного обучения с подкреплением нет стандартизации, и авторы всех ранее существующих работ были вынуждены каждый раз собирать новый датасет с нуля, добавляют разработчики. Они полагают, что опубликованные наборы данных помогут демократизировать исследования, ускорят развитие этого направления обучения и масштабирование технологий.


Читать далее:

Посмотрите, как выглядит полярное сияние из космоса

Случайность спасла Землю от мощнейшей солнечной вспышки

Пациенту впервые пересадили титановое сердце на магнитной подвеске

На обложке: Изображение от freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Самый емкий в мире аккумулятор на 8 МВт·ч поместился в контейнер
Новости
Крупнейший в мире маховичный накопитель энергии заработал в Китае
Новости
Аналог Starlink создают в России: сколько будет стоить проект
Космос
Скоро в России начнут маркировать видеоигры: как и зачем это нужно
Новости
VK запускает платформу для создания ИИ без навыков программирования
Новости
Клетки рака перепрограммировали для борьбы с опухолями
Наука
Инженер-любитель собрал машину с двумя двигателями от самолета
Новости
Пациент с нейрочипом управляет голосовым помощником силой мысли
Наука
У Земли были кольца: они обрушились на планету 500 млн лет назад
Космос
Открыта новая система групп крови: она связана с редкой аномалией
Наука
Астронавт сфотографировал с МКС возвращение частной миссии на Землю
Космос
Генетики увеличили содержание витамина в листьях салата в 30 раз
Наука
Астрономы разгадали тайну масштабных бурь на Уране и Нептуне
Космос
Активная черная дыра «морит голодом» свою галактику
Космос
Под дворцом епископа в Польше нашли могилу «ребенка вампира»
Наука
Международные эксперты обсудят будущее ИИ на Digital Innopolis Days 2024
Иннополис
Разработаны прозрачные фотоэлементы: их можно встроить в экран смартфона и стекло машины
Новости
Древнейшую карту мира расшифровали: какие секреты Вавилона она скрывала
Наука
Тайна происхождения Цереры наконец-то раскрыта
Космос
Сбой в работе Wildberries: что происходит
Новости