Создана нейросеть, которая подбирает лучший ИИ для разных задач

Платформа для оценки больших языковых моделей LMArena запустила нейросеть Prompt-to-leaderboard (P2L), которая создает рейтинги ИИ-моделей под конкретные пользовательские запросы на основе миллионов оценок реальных людей.

Нейросеть Prompt-to-leaderboard (P2L), анализирует задачу пользователя и мгновенно определяет, какие языковые модели справятся с ней наилучшим образом. Для обучения системы разработчики использовали более 2 млн оценок предпочтений, собранных от пользователей платформы Chatbot Arena.

P2L не только мгновенно формирует таблицы лидеров для любого запроса, но и проводит детальный анализ сильных и слабых сторон каждой модели. Например, система выявила, что модель o1-mini от OpenAI демонстрирует превосходные результаты в арифметических вычислениях, но испытывает трудности при создании художественных текстов в жанре хоррор.

По утверждению разработчиков, технология маршрутизации запросов P2L заняла первое место на соревнованиях Chatbot Arena в январе 2025 года с результатом 1395 баллов. Исследование с описанием принципов работы P2L опубликовано на портале препринтов arXiv, а исходный код доступен в GitHub.

Разработчики опубликовали в своем блоге в социальной сети X несколько примеров запросов, которые выполнила P2L. Например, она показали, что с операцией умножения лучше справится o1-mini, а по запросу «теперь веди себя неподобающе» показала список ИИ, в которых меньше ограничений связанных с цензурой.

Попробовать сервис можно на сайте платформы LMArena.


Читать далее:

Время может двигаться вперед и назад одновременно: что выяснили физики

Космологический принцип Вселенной поставили под сомнение

Новая смелая гипотеза переписывает историю Вселенной

Иллюстрация на обложке: Изображение от tohamina на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Силикон сделали проводником и заставили сиять: это считалось невозможным
Наука
Разработаны контактные линзы ночного зрения: они позволяют видеть в темноте
Наука
Китайские роботы показали боевые навыки перед первым турниром по робобоксу
Новости
«Нежелательные колебания атомов» использовали для хранения информации
Наука
Тайны Иерусалима: под полом древнего здания нашли золотые драгоценности 
Наука
Microsoft добавила ИИ в «Блокнот» и Paint: что умеют новые функции в Windows 11
Новости
В России научились собирать беспилотники с помощью цифрового помощника
Наука
Пять планет можно увидеть невооружённым глазом в июне: где и когда смотреть в России
Космос
Частная космическая компания проведет стыковку спутников на орбите
Космос
Черные дыры могут незаметно расти внутри звезд, считают астрофизики
Космос
Раскрыто происхождение зубной боли: чувствительность зародилась в панцире древних рыб
Наука
В сети нашли базу с паролями от 184 млн аккаунтов, включая Google, Apple и Meta*
Новости
Физики объяснили, как звуковые удары от самолетов попадают в помещения
Наука
Астрономы наблюдали жесткую космическую «битву» двух галактик
Космос
Новая система от Google распознает контент, который сделал ИИ
Новости
Приехали: почему россияне пересаживаются с прокатных на личные электросамокаты
Новости
Очередные тарифы Трампа сломают интернет: что нас ждет
Новости
За мигрантами в Москве будут следить через смартфоны: как работает эксперимент
Новости
Нейросеть, которая ускоряет разработку лекарств, сделали в России
Наука
Российский аналог Raspberry Pi на процессоре СКИФ создали в Новосибирске
Новости