Разработчики DeepSeek использовали для обучения выпущенной на прошлой неделе модели r1-0528 синтетические данные, полученные с помощью ИИ Google, считают аналитики.
На прошлой неделе китайская компания DeepSeek представила обновленную версию своей модели искусственного интеллекта R1, которая показала высокие результаты в тестах на математику и программирование. Однако компанию опять обвиняют в неэтичных методах обучения ИИ.
Сэм Пейч, разработчик из Мельбурна, опубликовал данные, которые, по его мнению, доказывают использование DeepSeek для обучения модели данные полученные с помощью Gemini компании Google. Согласно анализу Пейча, модель DeepSeek R1-0528 предпочитает использовать слова и выражения, характерные для Google Gemini 2.5 Pro.
If you're wondering why new deepseek r1 sounds a bit different, I think they probably switched from training on synthetic openai to synthetic gemini outputs. pic.twitter.com/Oex9roapNv
— Sam Paech (@sam_paech) May 29, 2025
Его выводы подтверждает анонимный создатель системы оценки ИИ SpeechMap, отметивший, что внутренние процессы DeepSeek — «мысли», которые система генерирует в процессе работы над ответом, — по структуре напоминают аналогичные процессы в Gemini.
Это не первый случай обвинений в адрес китайской компании. В декабре прошлого года разработчики обнаружили, что модель DeepSeek V3 часто идентифицировала себя как ChatGPT. Это указывало на возможное использование журналов чатов модели от OpenAI в процессе обучения.
Ранее в этом году OpenAI сообщила о наличии доказательств использования DeepSeek метода дистилляции — технологии обучения модели с помощью извлечения знаний из более крупных и эффективных систем. Microsoft обнаружила, что в конце 2024 года через аккаунты разработчиков OpenAI выгрузили большие объемы данных, OpenAI связывает это с DeepSeek.
Хотя дистилляция не является редкой практикой, условия использования, например, сервисов OpenAI запрещают клиентам использовать результаты работы моделей компании для создания конкурирующих систем.
Читать далее:
Спутник показал гигантские волны, которые девять дней сотрясали Землю
Физики поняли, что произошло в первые секунды Вселенной: это их удивило