DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

Китайская компания DeepSeek выпустила обновленную версию своей большой языковой модели DeepSeek-V3. По данным компании, новая версия превосходит предыдущую в нескольких бенчмарках, а также демонстрирует улучшенную производительность.

По данным разработчиков, модель демонстрирует лучшую производительность в ряде бенчмарков и отличается эффективным использованием ресурсов. Одновременно компания объявила о переходе на лицензию MIT, которая позволяет использовать модель без ограничений, в том числе в коммерческих проектах.

Сравнение моделей. Источник: DeepSeek

Особенность новой версии DeepSeek-V3 — архитектура с выборочной активацией параметров. При общем объеме в 671 млрд параметров модель использует в работе лишь около 37 млрд, что резко снижает требования к инфраструктуре. Кроме того, применяется четырехбитное квантование, позволяющее экономить память почти без потери качества.

По словам научного сотрудника Apple Авни Ханнуна, ему удалось запустить DeepSeek-V3 локально на Mac Studio, где она работала со скоростью около 20 токенов в секунду. Это делает модель одной из самых производительных в своем классе, учитывая масштабы и аппаратные ограничения.

Разработчики отмечают рост эффективности модели в задачах программирования. По их данным, в сравнении с предыдущей версией точность выполнения подобных задач выросла на несколько процентных пунктов, хотя DeepSeek-V3 пока уступает узкоспециализированным инструментам.

В начале года DeepSeek вызвала резонанс на ИИ-рынке заявлением о рекордно низкой стоимости обучения модели — $6 млн. Это на два порядка ниже, чем у большинства конкурентов. Заявление вызвало волну обсуждений и даже кратковременное падение акций ведущих технологических компаний США.

Позже аналитики уточнили, что DeepSeek указывала только затраты на активное время работы GPU, не включая инфраструктуру, зарплаты, хранение данных и закупку оборудования. По данным SemiAnalysis, реальные затраты на обучение модели могли составить сотни миллионов долларов, что всё ещё ниже, чем у крупных игроков, но не столь революционно, как было заявлено.


Читать далее:

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды

Миллионы «невидимых» людей: ученые нашли ошибку в оценке населения Земли

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости