Создатели ChatGPT представили gpt-oss-120b и gpt-oss-20b — первые большие языковые модели OpenAI с открытыми весами после GPT-2, выпущенной в 2019 году.
OpenAI выпустила две модели искусственного интеллекта с открытыми весами — gpt-oss-120b и gpt-oss-20b, которые пользователи могут загрузить и запускать на собственном оборудовании. Обе модели поддерживают технологию пошаговых рассуждений (Chain of Thought).
Параметры цепочки рассуждений можно настраивать: доступны три уровня — низкий, средний и высокий. При низкой настройке модель работает быстрее и требует меньше ресурсов, при высокой — обеспечивает лучшие результаты за счет большего числа вычислений.
У модели gpt-oss-20b 21 млрд параметров, которые сокращаются до 3,6 млрд на токен с помощью алгоритма «смесь экспертов» (Mixture of Experts). gpt-oss-120b содержит 117 млрд параметров, сокращающихся до 5,1 млрд на токен. Компания заявляет, для работы младшей модели достаточно ПК с 16 ГБ оперативной памяти, для gpt-oss-120b — от 80 ГБ.

Контекстное окно — максимальный объем текста, который модель может обработать за один раз — составляет 128 000 токенов. Модели обучены преимущественно на англоязычных данных с акцентом на науку и технологии, программирование и общие знания.
По результатам внутренних тестов, производительность открытых моделей сопоставима с ведущими облачными аналогами OpenAI. Более крупная версия в большинстве тестов показала уровень между фирменными моделями o3-mini и o4-mini, а младшая версия лишь немного отстала. Особенно хорошо обе модели справляются с задачами по математике и программированию.


В тесте «Последний экзамен человечества» (Humanity’s Last Exam) gpt-oss-120b набирает 19%. Это ниже, чем у облачной модели o3 от OpenAI (24,9%) и текущего лидера — Google Gemini Deep Think (34,8%).

Компания подчеркивает, что не планирует заменять проприетарные модели новыми open-weight-версиями. Однако в некоторых задачах локальные модели удобнее: на них не влияют сетевые задержки, у них больше возможностей для настройки под задачу и больший контроль над безопасностью конфиденциальных данных.


Модели gpt-oss работают только с текстом и не являются мультимодальными. Однако они гибко настраиваются, поддерживают структурированные выходные данные и совместимы с API OpenAI. Модели можно загрузить на платформе HuggingFace и в репозитории на GitHub. Также попробовать gpt-oss можно прямо на сайте OpenAI.
Читать далее:
Восстановлен облик двух сестер, которые работали на шахте 6 000 лет назад
3D-моделирование объяснило, как создан знаменитый христианский артефакт
Личные диалоги с ChatGPT попали в поисковик Google: это ошибка пользователей
На обложке: Image by frimufilms on Freepik, лицензия