Недавно DeepSeek произвел фурор на рынке ИИ, представив R1 — большую языковую модель, которая, как утверждают разработчики, способна воспроизводить функции лучших нейросетей, но на обучение которой ушло в 20 раз меньше средств, чем у американских компаний. Исследователи из Беркли за $30 создали версию модели TinyZero, которая воспроизводит основные характеристики DeepSeek R1.
TinyZero опубликовали в открытом доступе на GitHub для экспериментов. Хотя в маленькой модели нет 671-миллиарда параметров, как в DeepSeek, разработчики утверждают, что TinyZero воспроизводит основные функции, наблюдаемые в DeepSeek «R1-Zero».
Подход ученых основан на обучении с подкреплением, технике, в которой ИИ, начиная с почти случайных догадок, постепенно уточняет свои ответы, пересматривая и перебирая возможные решения.
В посте, описывающем проект, ученые показали работу на примере игры Countdown. Это британская телевизионная головоломка, в которой игроки объединяют заданные числа, чтобы достичь целевого значения. Эксперименты показали, что хотя изначально ИИ выдавал «фиктивные результаты», в конечном итоге он понял, как исправить свои ошибки.
We reproduced DeepSeek R1-Zero in the CountDown game, and it just works
— Jiayi Pan (@jiayi_pirate) January 24, 2025
Through RL, the 3B base LM develops self-verification and search abilities all on its own
You can experience the Ahah moment yourself for < $30
Code: https://t.co/B2IsN1PrXV
Here's what we learned 🧵 pic.twitter.com/43BVYMmS8X
Исследование бросает вызов устоявшемуся мнению о колоссальных затратах на разработку передовых ИИ-систем. Если DeepSeek заявлял о нескольких млн долларов на обучение своей модели, что удивительно мало для рынка ИИ, то американские ученые утверждают, что в малых масштабах это можно сделать всего за $30.
Хотя TinyZero выглядит скорее доказательством концепции, нежели полноценной заменой оригинальной модели, это еще один пример потенциала компактных и бюджетных решений.
Исследование поднимает вопросы о правильности стратегии технологических гигантов вроде OpenAI, Google и Microsoft, которые инвестируют сотни миллионов долларов в разработку ИИ. Руководитель исследования Цзяи Пан подчеркивает основную цель проекта — развенчать мифы о необходимости масштабных затрат в исследованиях ИИ.
Читать далее:
Потенциально обитаемую планету нашли недалеко от нас: она похожа на Землю
Посмотрите, как сверхзвуковой самолет Boom Supersonic преодолел звуковой барьер
89 секунд до ядерной войны: почему «Часы Судного дня» только что перевели на рекордное время