Qwen3-Coder от Alibaba показывает рекордные результаты в агентном программировании среди open source-моделей.
Китайская компания Qwen, входящая в Alibaba, объявила о выпуске модели Qwen3-Coder — ИИ-помощника для программистов с открытым исходным кодом. По результатам тестов, опубликованных разработчиками, система устанавливает рекорды среди open source-решений и по качеству приближается к Claude Sonnet 4 и превосходит GPT-4.1.
Флагманская версия модели — Qwen3-Coder-480B-A35B-Instruct — построена на архитектуре Mixture-of-Experts и содержит 480 млрд параметров, из которых активно задействуется 35 млрд. Она поддерживает контекст длиной до 256 тыс. токенов с возможностью расширения до миллиона, что позволяет обрабатывать целые репозитории кода и сложные проекты.
Разработчики утверждают, что решение устанавливает новые стандарты среди открытых моделей в области агентного программирования, использования браузера и работы с инструментами разработки. По опубликованным бенчмаркам, Qwen3-Coder сопоставим по производительности с Claude Sonnet 4 — одной из ведущих коммерческих моделей для программирования.

Разработчики отмечают, что модель хорошо справляется с задачами агентного программирования — когда ИИ сам планирует действия, использует инструменты и принимает решения при разработке ПО. В тестах Qwen3-Coder показал производительность на уровне Claude Sonnet 4 и опередил другие открытые решения в бенчмарке SWE-Bench Verified, где оценивается умение решать реальные задачи программирования.
Параллельно команда выпустила инструмент командной строки Qwen Code — облегченный интерфейс для взаимодействия с моделью, адаптированный под задачи автоматизации программирования. Он создан на основе Gemini Code и легко интегрируется с популярными IDE.
Qwen активно использовала обучение с подкреплением. Команда разработала систему генерации тестов для разных типов задач и запустила инфраструктуру, способную одновременно обрабатывать до 20 тыс. изолированных сред для тренировки модели.
Qwen3-Coder обучалась на корпусе в 7,5 трлн токенов, 70% которых составили фрагменты программного кода. Дополнительно использовались синтетические данные, очищенные и переписанные с помощью предыдущей версии — Qwen2.5-Coder.
Модель доступна для тестирования на Hugging Face, а исходный код опубликован на GitHub.
Читать далее:
Загадочный радиосигнал из далекого космоса поставил астрономов в тупик
В Италии нашли нетронутую 2600-летнюю этрусскую гробницу с сотней артефактов
Инженеры НАСА починили камеру зонда «Юнона» на расстоянии 595 млн км
Иллюстрация на обложке: designed by Freepik, лицензия