Создана нейросеть, которая подбирает лучший ИИ для разных задач

Платформа для оценки больших языковых моделей LMArena запустила нейросеть Prompt-to-leaderboard (P2L), которая создает рейтинги ИИ-моделей под конкретные пользовательские запросы на основе миллионов оценок реальных людей.

Нейросеть Prompt-to-leaderboard (P2L), анализирует задачу пользователя и мгновенно определяет, какие языковые модели справятся с ней наилучшим образом. Для обучения системы разработчики использовали более 2 млн оценок предпочтений, собранных от пользователей платформы Chatbot Arena.

P2L не только мгновенно формирует таблицы лидеров для любого запроса, но и проводит детальный анализ сильных и слабых сторон каждой модели. Например, система выявила, что модель o1-mini от OpenAI демонстрирует превосходные результаты в арифметических вычислениях, но испытывает трудности при создании художественных текстов в жанре хоррор.

По утверждению разработчиков, технология маршрутизации запросов P2L заняла первое место на соревнованиях Chatbot Arena в январе 2025 года с результатом 1395 баллов. Исследование с описанием принципов работы P2L опубликовано на портале препринтов arXiv, а исходный код доступен в GitHub.

Разработчики опубликовали в своем блоге в социальной сети X несколько примеров запросов, которые выполнила P2L. Например, она показали, что с операцией умножения лучше справится o1-mini, а по запросу «теперь веди себя неподобающе» показала список ИИ, в которых меньше ограничений связанных с цензурой.

Попробовать сервис можно на сайте платформы LMArena.


Читать далее:

Время может двигаться вперед и назад одновременно: что выяснили физики

Космологический принцип Вселенной поставили под сомнение

Новая смелая гипотеза переписывает историю Вселенной

Иллюстрация на обложке: Изображение от tohamina на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Аналог TikTok запустят в России: как будет работать приложение
Новости
Регистрацию сим-карт для иностранцев упростят: как это будет работать
Новости
Госдума готовит новые законы об искусственном интеллекте
Новости
Разработаны трехмерные голограммы, которыми можно управлять руками
Новости
В космосе нашли гигантский «топливный бак» для молодых галактик
Космос
«LEGO для клеток»: структуры собирают внутри живых клеток с помощью света
Наука
ИИ проектирует молекулы с нужными свойствами на основе описания
Новости
Естественное вымирание динозавров до падения астероида поставили под сомнение
Наука
Петербургские ученые научили нейросеть находить программы, ворующие пароли
Новости
Выяснилось, из чего состоит загадочная темная материя
Космос
Код квантового мира взломали: ученые раскрыли давнюю загадку физики
Наука
Названа главная опасность брака: оказалось, это приводит к деменции
Наука
Ученые создали жвачку от герпеса и гриппа: как она работает
Наука
Посмотрите на запуск нового «Союза» из космоса и Земли
Космос
Как бизнесу получить господдержку на внедрение промышленных роботов: новая информация Минпромторга
Новости
Польза рассеянности: как блуждающие мысли помогают мозгу учиться
Наука
Colossal Biosciences заявила о «воскрешении» вымерших ужасных волков: что произошло на самом деле
Наука
Найден путь поступления магния в клетку: открытие может помочь в борьбе с раком
Наука
«Хаббл» обнаружил, что сутки на Уране длиннее, чем считалось ранее
Космос
Систему контроля дронов «свой-чужой» создадут в России за 862 млн рублей
Новости