Deep Research от OpenAI набрал рекордный балл в «Последнем экзамене человечества»

Компания OpenAI представила новый инструмент искусственного интеллекта (ИИ) DeepSearch, который может проводить сложные многоступенчатые исследования для поиска правильного ответа.

Компания OpenAI объявила о запуске в ChatGPT нового инструмента Deep Research («Глубокие исследования»). Технология предназначена для проведения расширенных исследований и решения сложных задач. В бенчмарке «Последний экзамен человечества» (Humanity’s Last Exam) система достигла рекордного показателя 26,6%, что существенно превосходит запущенные в этом году модели o3-mini (high) — 13%, DeepSeek-R1 — 9,4%.

Результаты различных моделей в «Последнем экзамене человечества». Данные: OpenAI

Deep Research планирует по шагам и выполняет сложные исследовательские задачи, при необходимости корректирует свой подход на основе полученных данных. Пользователи могут загружать различные типы файлов, включая изображения, PDF-документы и электронные таблицы, для более точного анализа. Исследование может занимать от 5 до 30 минут, а результаты представляются в формате чата с подробным описанием использованной методологии.

Новая функция уже доступна по подписке ChatGPT Pro стоимостью $200 в месяц с лимитом в 100 запросов. Кроме того, OpenAI планирует предоставить доступ с ограниченным количеством запросов для пользователей тарифов Plus, Team и Enterprise. Ограничения связаны с высокой ресурсоёмкостью DeepSearch, отмечают в компании.

Презентация Deep Research

Несмотря на впечатляющие результаты, разработчики предупреждают о возможных ограничениях системы. DeepSearch, как и другие модели, может иногда «галлюцинировать», создавая недостоверные факты, и испытывает трудности в различении авторитетных источников информации от слухов.

«Последний экзамен человечества» — тест, разработанный для оценки возможностей систем ИИ решать наиболее сложные вопросы в различных научных дисциплинах. Он оценивает, насколько ИИ приблизился к экспертному уровню знаний, как в гуманитарных, так и в естественнонаучных дисциплинах.

Тест состоит из 3000 вопросов, охватывающих несколько тем, которые остаются сложными даже для высококвалифицированных специалистов в своих областях. Вопросы отобрали при участии ведущих исследователей из лучших университетов так, чтобы у них не было двойного толкования и ответ можно было проверить. При этом ни на один вопрос нельзя быстро ответить с помощью поиска в интернете.


Читать далее:

Квантовая физика оказалась более странной, чем считалось: что показал новый эксперимент

Потенциально обитаемую планету нашли недалеко от нас: она похожа на Землю

Посмотрите, как сверхзвуковой самолет Boom Supersonic преодолел звуковой барьер

На обложке: Image by frimufilms on Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найден способ сверхскоростной передачи тепла для быстрого охлаждения электроники
Наука
Условия жизни лошадей в Средневековом Новгороде восстановили по зубам
Наука
Под видом модов для Minecraft и других игр в Telegram распространяют вирусы
Новости
ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
Новости
В России нашли минерал, который поможет изучить ядро Земли и космические тела
Космос
Анализ метеорита поставил под сомнение гипотезу о происхождении воды на Земле
Космос
«Яндекс» научил поиск решать задачи по алгебре для старшеклассников
Новости
Найдена недостающая часть Вселенной: где она скрывалась
Космос
VR в строительстве: как избежать ошибок на сотни миллионов
Мнения
44 планеты, похожие на Землю, нашли в Млечном Пути
Космос
Тайну космоса, которой больше 60 лет, наконец-то раскрыли
Космос
В «дубайском» шоколаде нашли опасные для жизни вещества
Наука
Хакеры атаковали пять оборонных предприятий России
Новости
Как ИИ повышает эффективность и снижает риски обогатительных предприятий
Мнения
«Джеймс Уэбб» изучил загадочные кольца погибшей звезды
Космос
Открыт прием заявок на ежегодную премию Digital Leaders 2025
Новости
GigaChat научился искать информацию в сети: Сбер обновил ИИ-помощника
Новости
Созданы очки с искусственным интеллектом для незрячих людей
Новости
Минобрнауки продолжит программу кешбэка для инвесторов университетских стартапов
Новости
OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов
Новости