OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов

OpenAI запустила новое семейство больших языковых моделей GPT-4.1. По данным бенчмарков, преимущества в первую очередь будут заметны при решении задач программирования. Кроме того, система может обрабатывать до миллиона токенов: объема, эквивалентного роману «Война и мир».

OpenAI в понедельник представила новую линейку моделей GPT-4.1. Семейство включает три версии: полноценную GPT-4.1, более компактную GPT-4.1 mini и сверхлегкую GPT-4.1 nano. Все три модели обрабатывают рекордно длинные запросы: до миллиона токенов. Для текста это около 750 000 слов за один запрос. Это расширяет возможности работы с большими базами кода и сложными проектами.

Новые модели запустили на фоне усиливающейся конкуренции в сфере искусственного интеллекта для программирования. Google недавно выпустила Gemini 2.5 Pro с аналогичным контекстным окном, а Anthropic представила Claude 3.7 Sonnet — обе модели показывают высокие результаты в бенчмарках кодирования. Китайский стартап DeepSeek также недавно обновил свою модель V3.

По заявлению OpenAI, компания оптимизировала GPT-4.1 на основе обратной связи от разработчиков, в том числе улучшила кодирование интерфейсов и уменьшила количество ненужных правок. Изменения позволяют создавать агентов, которые значительно лучше справляются с реальными задачами по разработке, заявили в OpenAI.

Согласно внутреннему тестированию, GPT-4.1 достиг результатов от 52% до 54,6% на бенчмарке SWE-bench Verified, что несколько ниже показателей Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). При этом модель установила рекорд в 72% точности в категории «длинных видео без субтитров» в тесте Video-MME.

Сравнение моделей OpenAI в бенчмарках для разработчиков. Источник: OpenAI

Несмотря на рекордные возможности для запроса, OpenAI признает, что надежность GPT-4.1 снижается с увеличением объема входных данных. Например, в одном из тестов точность модели упала с 84% при 8000 токенов до 50% при миллионе токенов.

Новые модели доступны через API OpenAI, но не через ChatGPT. GPT-4.1 стоит $2 за миллион входных токенов и $8 за миллион выходных токенов, GPT-4.1 mini — $0,40 и $1,60 соответственно, а GPT-4.1 nano — $0,10 и $0,40.


Читать далее:

Эйнштейн ошибся: возможно, пространства-времени вообще не существует

Мошенники начали использовать схему с домофоном, чтобы красть деньги с банковских карт

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Обложка: Flickr | Сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос