Deep Research от OpenAI набрал рекордный балл в «Последнем экзамене человечества»

Компания OpenAI представила новый инструмент искусственного интеллекта (ИИ) DeepSearch, который может проводить сложные многоступенчатые исследования для поиска правильного ответа.

Компания OpenAI объявила о запуске в ChatGPT нового инструмента Deep Research («Глубокие исследования»). Технология предназначена для проведения расширенных исследований и решения сложных задач. В бенчмарке «Последний экзамен человечества» (Humanity’s Last Exam) система достигла рекордного показателя 26,6%, что существенно превосходит запущенные в этом году модели o3-mini (high) — 13%, DeepSeek-R1 — 9,4%.

Результаты различных моделей в «Последнем экзамене человечества». Данные: OpenAI

Deep Research планирует по шагам и выполняет сложные исследовательские задачи, при необходимости корректирует свой подход на основе полученных данных. Пользователи могут загружать различные типы файлов, включая изображения, PDF-документы и электронные таблицы, для более точного анализа. Исследование может занимать от 5 до 30 минут, а результаты представляются в формате чата с подробным описанием использованной методологии.

Новая функция уже доступна по подписке ChatGPT Pro стоимостью $200 в месяц с лимитом в 100 запросов. Кроме того, OpenAI планирует предоставить доступ с ограниченным количеством запросов для пользователей тарифов Plus, Team и Enterprise. Ограничения связаны с высокой ресурсоёмкостью DeepSearch, отмечают в компании.

Презентация Deep Research

Несмотря на впечатляющие результаты, разработчики предупреждают о возможных ограничениях системы. DeepSearch, как и другие модели, может иногда «галлюцинировать», создавая недостоверные факты, и испытывает трудности в различении авторитетных источников информации от слухов.

«Последний экзамен человечества» — тест, разработанный для оценки возможностей систем ИИ решать наиболее сложные вопросы в различных научных дисциплинах. Он оценивает, насколько ИИ приблизился к экспертному уровню знаний, как в гуманитарных, так и в естественнонаучных дисциплинах.

Тест состоит из 3000 вопросов, охватывающих несколько тем, которые остаются сложными даже для высококвалифицированных специалистов в своих областях. Вопросы отобрали при участии ведущих исследователей из лучших университетов так, чтобы у них не было двойного толкования и ответ можно было проверить. При этом ни на один вопрос нельзя быстро ответить с помощью поиска в интернете.


Читать далее:

Квантовая физика оказалась более странной, чем считалось: что показал новый эксперимент

Потенциально обитаемую планету нашли недалеко от нас: она похожа на Землю

Посмотрите, как сверхзвуковой самолет Boom Supersonic преодолел звуковой барьер

На обложке: Image by frimufilms on Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
GigaChat готовится к выходу в космос: нейросеть от Сбера станет ассистентом космонавтов на МКС
Космос
Млечный Путь может избежать столкновения с Андромедой: но есть нюанс
Космос
Россия развернет 886 спутников «Рассвет» для интернета до 2030 года
Космос
Юра Борисов может сыграть сооснователя OpenAI, разработавшей ChatGPT: что известно прямо сейчас
Новости
Физики создали «самую маленькую скрипку в мире»: она тоньше человеческого волоса
Новости
Воссоздан рецепт производства древнейшего красителя: его использовали в Древнем Египте
Наука
Конкурент Neuralink впервые испытал мозговой имплантат на человеке
Новости
Спутник показал гигантские волны, которые девять дней сотрясали Землю
Наука
Ученые раскрыли секрет памяти: как мозг запоминает и воспоминает информацию
Наука
Экспериментальные российские спутники связи выведут на орбиту уже в этом году: что о них известно
Наука
Подо льдами Антарктиды нашли следы затерянного мира
Наука
Физики поняли, что произошло в первые секунды Вселенной: это их удивило
Космос
Секретный ИИ-гаджет от OpenAI принесет миллионы вдове Джобса: о чем идет речь
Новости
Отец устал слушать сына и «сбагрил» его ChatGPT: что из этого вышло
Новости
Выяснилось, что влияет на самооценку мужчин на самом деле
Наука
Ютубер собрал из «мусора» ручной лазер, прожигающий алмазы
Новости
Физики придумали, как создать настольный ускоритель частиц с мощностью гигантских установок
Наука
Китайский робот научился готовить пельмени и пользоваться палочками
Новости
Цифровые лидеры нового времени: объявлены лауреаты ежегодной Премии Digital Leaders-2025
Новости
Древнейший «арт-объект» неандертальцев с отпечатком автора, нашли в Испании
Наука