DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

Китайская компания DeepSeek выпустила обновленную версию своей большой языковой модели DeepSeek-V3. По данным компании, новая версия превосходит предыдущую в нескольких бенчмарках, а также демонстрирует улучшенную производительность.

По данным разработчиков, модель демонстрирует лучшую производительность в ряде бенчмарков и отличается эффективным использованием ресурсов. Одновременно компания объявила о переходе на лицензию MIT, которая позволяет использовать модель без ограничений, в том числе в коммерческих проектах.

Сравнение моделей. Источник: DeepSeek

Особенность новой версии DeepSeek-V3 — архитектура с выборочной активацией параметров. При общем объеме в 671 млрд параметров модель использует в работе лишь около 37 млрд, что резко снижает требования к инфраструктуре. Кроме того, применяется четырехбитное квантование, позволяющее экономить память почти без потери качества.

По словам научного сотрудника Apple Авни Ханнуна, ему удалось запустить DeepSeek-V3 локально на Mac Studio, где она работала со скоростью около 20 токенов в секунду. Это делает модель одной из самых производительных в своем классе, учитывая масштабы и аппаратные ограничения.

Разработчики отмечают рост эффективности модели в задачах программирования. По их данным, в сравнении с предыдущей версией точность выполнения подобных задач выросла на несколько процентных пунктов, хотя DeepSeek-V3 пока уступает узкоспециализированным инструментам.

В начале года DeepSeek вызвала резонанс на ИИ-рынке заявлением о рекордно низкой стоимости обучения модели — $6 млн. Это на два порядка ниже, чем у большинства конкурентов. Заявление вызвало волну обсуждений и даже кратковременное падение акций ведущих технологических компаний США.

Позже аналитики уточнили, что DeepSeek указывала только затраты на активное время работы GPU, не включая инфраструктуру, зарплаты, хранение данных и закупку оборудования. По данным SemiAnalysis, реальные затраты на обучение модели могли составить сотни миллионов долларов, что всё ещё ниже, чем у крупных игроков, но не столь революционно, как было заявлено.


Читать далее:

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды

Миллионы «невидимых» людей: ученые нашли ошибку в оценке населения Земли

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Китайский робот научился готовить пельмени и пользоваться палочками
Новости
Цифровые лидеры нового времени: объявлены лауреаты ежегодной Премии Digital Leaders-2025
Новости
Древнейший «арт-объект» неандертальцев с отпечатком автора, нашли в Испании
Наука
На Урале разработали сверхпрочное покрытие для защиты авиадвигателей
Наука
Сверхтонкая линза делает видимым инфракрасное излучение
Наука
Новый закон об иностранных мессенджерах вступил в силу в России
Новости
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости