OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов

OpenAI запустила новое семейство больших языковых моделей GPT-4.1. По данным бенчмарков, преимущества в первую очередь будут заметны при решении задач программирования. Кроме того, система может обрабатывать до миллиона токенов: объема, эквивалентного роману «Война и мир».

OpenAI в понедельник представила новую линейку моделей GPT-4.1. Семейство включает три версии: полноценную GPT-4.1, более компактную GPT-4.1 mini и сверхлегкую GPT-4.1 nano. Все три модели обрабатывают рекордно длинные запросы: до миллиона токенов. Для текста это около 750 000 слов за один запрос. Это расширяет возможности работы с большими базами кода и сложными проектами.

Новые модели запустили на фоне усиливающейся конкуренции в сфере искусственного интеллекта для программирования. Google недавно выпустила Gemini 2.5 Pro с аналогичным контекстным окном, а Anthropic представила Claude 3.7 Sonnet — обе модели показывают высокие результаты в бенчмарках кодирования. Китайский стартап DeepSeek также недавно обновил свою модель V3.

По заявлению OpenAI, компания оптимизировала GPT-4.1 на основе обратной связи от разработчиков, в том числе улучшила кодирование интерфейсов и уменьшила количество ненужных правок. Изменения позволяют создавать агентов, которые значительно лучше справляются с реальными задачами по разработке, заявили в OpenAI.

Согласно внутреннему тестированию, GPT-4.1 достиг результатов от 52% до 54,6% на бенчмарке SWE-bench Verified, что несколько ниже показателей Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). При этом модель установила рекорд в 72% точности в категории «длинных видео без субтитров» в тесте Video-MME.

Сравнение моделей OpenAI в бенчмарках для разработчиков. Источник: OpenAI

Несмотря на рекордные возможности для запроса, OpenAI признает, что надежность GPT-4.1 снижается с увеличением объема входных данных. Например, в одном из тестов точность модели упала с 84% при 8000 токенов до 50% при миллионе токенов.

Новые модели доступны через API OpenAI, но не через ChatGPT. GPT-4.1 стоит $2 за миллион входных токенов и $8 за миллион выходных токенов, GPT-4.1 mini — $0,40 и $1,60 соответственно, а GPT-4.1 nano — $0,10 и $0,40.


Читать далее:

Эйнштейн ошибся: возможно, пространства-времени вообще не существует

Мошенники начали использовать схему с домофоном, чтобы красть деньги с банковских карт

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Обложка: Flickr | Сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
«Солнцезащитный крем» и одежда могли помочь Homo sapiens пережить неандертальцев
Наука
Эта частица раскроет тайну невидимой Вселенной: физики впервые создали ее аналог 
Космос
Климатические аномалии помогли варварам завоевать римскую Британию
Наука
Ответ найден: как крокодилам удалось пережить два массовых вымирания
Наука
Оказалось, кошки не такие уж древние, как все считали
Наука
Терапия стволовыми клетками уменьшила тремор у пациентов с Паркинсоном
Наука
Неуловимый гигантский кальмар впервые попал на видео в естественной среде
Наука
У карликовых шимпанзе развито чувство справедливости, считают приматологи
Наука
В МИФИ создают детектор для «цветных» рентгеновских снимков
Наука
США прекратили финансирование базы CVE: в чем опасность для России
Новости
Голографический вентилятор с ИИ: будущее терминалов самообслуживания
Мнения
Найден способ сверхскоростной передачи тепла для быстрого охлаждения электроники
Наука
Условия жизни лошадей в Средневековом Новгороде восстановили по зубам
Наука
Под видом модов для Minecraft и других игр в Telegram распространяют вирусы
Новости
ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
Новости
В России нашли минерал, который поможет изучить ядро Земли и космические тела
Космос
Анализ метеорита поставил под сомнение гипотезу о происхождении воды на Земле
Космос
«Яндекс» научил поиск решать задачи по алгебре для старшеклассников
Новости
Найдена недостающая часть Вселенной: где она скрывалась
Космос
VR в строительстве: как избежать ошибок на сотни миллионов
Мнения