Китайский стартап Fire-Flyer заявил о создании модели искусственного интеллекта DeepSeek, способной конкурировать с ведущими разработками OpenAI и Anthropic при значительно меньших затратах
Компания Fire-Flyer объявила о выпуске новой модели DeepSeek R1, которая, по заявлению разработчиков, способна «рассуждать» и не уступает последним системам ИИ OpenAI в решении сложных задач. Разработчики заявляют об удивительной экономической эффективности проекта. В условиях санкций и запрета на поставки лучших графических чипов со стороны США, компания сконцентрировалась на минимизации ресурсов для обучения ИИ.
По словам разработчиков DeepSeek, компания потратила менее $6 млн на разработку модели V3 LLM, которую использует R1. Для сравнения создание GPT-4 обошлось OpenAI более чем в $100 млн. Более того, для обучения V3 потребовалось всего 2000 специализированных чипов Nvidia — против 16000, о которых рассказывали конкуренты.
Хотя заявления китайской компании как об удивительной экономичности, так и о том, что модель не уступает лучшим американским системами в некоторых бенчмарках, пока не подтверждены, рынок акций среагировал на выход новой системы. После начала торгов на бирже Nasdaq стоимость акций Nvidia — основного поставщика графических процессоров, используемых для обучения ИИ — опускалась с $142,6 до $122,9, а на 16:20 по московскому времени торгуется по цене около $126.
Если компании действительно удалось существенно сократить затраты на обучение ИИ, это ставит вопрос о целесообразности гигантских инвестиций в инфраструктуру дата-центров. Напомним, на прошлой неделе, например, OpenAI и Oracle заявили, что инвестируют $500 млрд в течение трех лет в ЦОДы для ИИ.
Читать далее:
В пустыне в Монголии нашли гигантские следы неизвестного динозавра
Астрофизики отследили источник радиосигнала из далекой галактики
Группы крови повлияли на вымирание неандертальцев, предполагают ученые
Иллюстрация на обложке: designed by Freepik, сведения о лицензии