DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

Китайская компания DeepSeek выпустила обновленную версию своей большой языковой модели DeepSeek-V3. По данным компании, новая версия превосходит предыдущую в нескольких бенчмарках, а также демонстрирует улучшенную производительность.

По данным разработчиков, модель демонстрирует лучшую производительность в ряде бенчмарков и отличается эффективным использованием ресурсов. Одновременно компания объявила о переходе на лицензию MIT, которая позволяет использовать модель без ограничений, в том числе в коммерческих проектах.

Сравнение моделей. Источник: DeepSeek

Особенность новой версии DeepSeek-V3 — архитектура с выборочной активацией параметров. При общем объеме в 671 млрд параметров модель использует в работе лишь около 37 млрд, что резко снижает требования к инфраструктуре. Кроме того, применяется четырехбитное квантование, позволяющее экономить память почти без потери качества.

По словам научного сотрудника Apple Авни Ханнуна, ему удалось запустить DeepSeek-V3 локально на Mac Studio, где она работала со скоростью около 20 токенов в секунду. Это делает модель одной из самых производительных в своем классе, учитывая масштабы и аппаратные ограничения.

Разработчики отмечают рост эффективности модели в задачах программирования. По их данным, в сравнении с предыдущей версией точность выполнения подобных задач выросла на несколько процентных пунктов, хотя DeepSeek-V3 пока уступает узкоспециализированным инструментам.

В начале года DeepSeek вызвала резонанс на ИИ-рынке заявлением о рекордно низкой стоимости обучения модели — $6 млн. Это на два порядка ниже, чем у большинства конкурентов. Заявление вызвало волну обсуждений и даже кратковременное падение акций ведущих технологических компаний США.

Позже аналитики уточнили, что DeepSeek указывала только затраты на активное время работы GPU, не включая инфраструктуру, зарплаты, хранение данных и закупку оборудования. По данным SemiAnalysis, реальные затраты на обучение модели могли составить сотни миллионов долларов, что всё ещё ниже, чем у крупных игроков, но не столь революционно, как было заявлено.


Читать далее:

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды

Миллионы «невидимых» людей: ученые нашли ошибку в оценке населения Земли

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Квантовый компьютер сгенерировал по-настоящему случайные числа
Новости
Загадка древних гигантов: ученые нашли организм, не похожий ни на что живое
Наука
Вскрытие мамонтенка Яны: в Якутии изучили древнюю тушу
Наука
Anthropic изучила «внутренний мир ИИ»: как языковые модели принимают решения
Новости
Дрон доставил обед: в Иннополисе испытали курьера с Telegram-управлением
Иннополис
Зонд Parker сблизился с Солнцем, собрав важнейшие данные
Космос
Спутниковую связь для обычных смартфонов протестируют в РФ
Новости
Российские ученые нашли безазотную замену тротилу и ракетному топливу
Наука
Российский рынок промышленной автоматизации удвоится к 2030 году, но есть сложности  
Новости
В Южной Корее вспыхнули крупнейшие лесные пожары: что происходит прямо сейчас
Наука
Беспилотники против браконьеров: в России расширят полномочия ведомств
Новости
В янтаре нашли осу с хвостом-ловушкой, как у венериной мухоловки
Наука
Физики из ИТМО разработали сверхтонкий материал для «умной» памяти
Наука
Средневековый языческий ритуал: археологи нашли козий череп под срубом в Новгороде
Наука
«Уэбб» снял полярные сияния Нептуна: они были не там, где ожидали ученые
Космос
Российские ученые разработали нейросеть, способную сомневаться в своих решениях
Новости
Найден способ прогнозировать осложнения после операций на сердце
Наука
Создан прототип квантового компьютера из «говорящих» атомов
Наука
Университетские стартапы получат новые возможности для роста
Новости
Ученые впервые записали звуки, которые издают акулы  
Наука