OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов

OpenAI запустила новое семейство больших языковых моделей GPT-4.1. По данным бенчмарков, преимущества в первую очередь будут заметны при решении задач программирования. Кроме того, система может обрабатывать до миллиона токенов: объема, эквивалентного роману «Война и мир».

OpenAI в понедельник представила новую линейку моделей GPT-4.1. Семейство включает три версии: полноценную GPT-4.1, более компактную GPT-4.1 mini и сверхлегкую GPT-4.1 nano. Все три модели обрабатывают рекордно длинные запросы: до миллиона токенов. Для текста это около 750 000 слов за один запрос. Это расширяет возможности работы с большими базами кода и сложными проектами.

Новые модели запустили на фоне усиливающейся конкуренции в сфере искусственного интеллекта для программирования. Google недавно выпустила Gemini 2.5 Pro с аналогичным контекстным окном, а Anthropic представила Claude 3.7 Sonnet — обе модели показывают высокие результаты в бенчмарках кодирования. Китайский стартап DeepSeek также недавно обновил свою модель V3.

По заявлению OpenAI, компания оптимизировала GPT-4.1 на основе обратной связи от разработчиков, в том числе улучшила кодирование интерфейсов и уменьшила количество ненужных правок. Изменения позволяют создавать агентов, которые значительно лучше справляются с реальными задачами по разработке, заявили в OpenAI.

Согласно внутреннему тестированию, GPT-4.1 достиг результатов от 52% до 54,6% на бенчмарке SWE-bench Verified, что несколько ниже показателей Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). При этом модель установила рекорд в 72% точности в категории «длинных видео без субтитров» в тесте Video-MME.

Сравнение моделей OpenAI в бенчмарках для разработчиков. Источник: OpenAI

Несмотря на рекордные возможности для запроса, OpenAI признает, что надежность GPT-4.1 снижается с увеличением объема входных данных. Например, в одном из тестов точность модели упала с 84% при 8000 токенов до 50% при миллионе токенов.

Новые модели доступны через API OpenAI, но не через ChatGPT. GPT-4.1 стоит $2 за миллион входных токенов и $8 за миллион выходных токенов, GPT-4.1 mini — $0,40 и $1,60 соответственно, а GPT-4.1 nano — $0,10 и $0,40.


Читать далее:

Эйнштейн ошибся: возможно, пространства-времени вообще не существует

Мошенники начали использовать схему с домофоном, чтобы красть деньги с банковских карт

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Обложка: Flickr | Сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости