Новости 6 августа 2025

OpenAI выпустила модели ИИ с открытыми весами: они запустятся даже на ПК

Создатели ChatGPT представили gpt-oss-120b и gpt-oss-20b — первые большие языковые модели OpenAI с открытыми весами после GPT-2, выпущенной в 2019 году.

OpenAI выпустила две модели искусственного интеллекта с открытыми весами — gpt-oss-120b и gpt-oss-20b, которые пользователи могут загрузить и запускать на собственном оборудовании. Обе модели поддерживают технологию пошаговых рассуждений (Chain of Thought).

Параметры цепочки рассуждений можно настраивать: доступны три уровня — низкий, средний и высокий. При низкой настройке модель работает быстрее и требует меньше ресурсов, при высокой — обеспечивает лучшие результаты за счет большего числа вычислений.

У модели gpt-oss-20b 21 млрд параметров, которые сокращаются до 3,6 млрд на токен с помощью алгоритма «смесь экспертов» (Mixture of Experts). gpt-oss-120b содержит 117 млрд параметров, сокращающихся до 5,1 млрд на токен. Компания заявляет, для работы младшей модели достаточно ПК с 16 ГБ оперативной памяти, для gpt-oss-120b — от 80 ГБ.

Результаты тестирования моделей gpt-oss в задачах по программированию в бенчмарке Codeforces. Изображение: OpenAI

Контекстное окно — максимальный объем текста, который модель может обработать за один раз — составляет 128 000 токенов. Модели обучены преимущественно на англоязычных данных с акцентом на науку и технологии, программирование и общие знания.

По результатам внутренних тестов, производительность открытых моделей сопоставима с ведущими облачными аналогами OpenAI. Более крупная версия в большинстве тестов показала уровень между фирменными моделями o3-mini и o4-mini, а младшая версия лишь немного отстала. Особенно хорошо обе модели справляются с задачами по математике и программированию.

Результаты тестирования моделей gpt-oss в медицинских задачах в бенчмарке HealthBench. Изображение: OpenAI

В тесте «Последний экзамен человечества» (Humanity’s Last Exam) gpt-oss-120b набирает 19%. Это ниже, чем у облачной модели o3 от OpenAI (24,9%) и текущего лидера — Google Gemini Deep Think (34,8%).

Результаты тестирования моделей gpt-oss в бенчмарке Humanity’s Last Exam. Изображение: OpenAI

Компания подчеркивает, что не планирует заменять проприетарные модели новыми open-weight-версиями. Однако в некоторых задачах локальные модели удобнее: на них не влияют сетевые задержки, у них больше возможностей для настройки под задачу и больший контроль над безопасностью конфиденциальных данных.

Результаты тестирования моделей gpt-oss в задачах по математике в бенчмарке AIME. Изображение: OpenAI

Модели gpt-oss работают только с текстом и не являются мультимодальными. Однако они гибко настраиваются, поддерживают структурированные выходные данные и совместимы с API OpenAI. Модели можно загрузить на платформе HuggingFace и в репозитории на GitHub. Также попробовать gpt-oss можно прямо на сайте OpenAI.

Читать далее:

Восстановлен облик двух сестер, которые работали на шахте 6 000 лет назад

3D-моделирование объяснило, как создан знаменитый христианский артефакт

Личные диалоги с ChatGPT попали в поисковик Google: это ошибка пользователей

_{На обложке: Image by frimufilms on Freepik, лицензия}

LLM

OpenAI

большая языковая модель

искусственный интеллект

открытый исходный код