Несколько дней назад загадочная модель Mogao неожиданно возглавила рейтинг Artificial Analysis Image Arena. Несколько дней сообщество строило предположения о происхождении таинственной модели. Наконец интрига раскрылась: ведущие генераторы изображений обошла Seedream 3.0 — новейшая разработка китайской компании ByteDance.
The Mogao Reveal: Congratulations to ByteDance Seed on launching Seedream 3.0, the new leading model on the Artificial Analysis Image Leaderboard, beating out GPT-4o, HiDream-I1-Dev, and Recraft V3
— Artificial Analysis (@ArtificialAnlys) April 15, 2025
Seedream 3.0 is the latest in the Seedream family of bilingual image diffusion… pic.twitter.com/k5WK1x5zJp
На момент публикации новости рейтинг изменился и GPT-4o, которая ранее взорвала интернет возможностями создавать изображения в стиле мультфильмов Хаяо Миядзаки, вернула себе первую позицию в общем рейтинге с минимальным отрывом. Тем не менее Seedream 3.0 сохраняет первое место в генерации фотореалистичных снимков и картинок в стиле аниме.
Seedream 3.0 пока не доступна для тестирования, но согласно техническому описанию, опубликованному на платформе arXiv, модель генерирует изображения с разрешением до 2048×2048 пикселей. Разработчики ByteDance заявляют, что решили проблемы с обработкой сложных запросов и созданием мелкозернистой типографики, характерные для предыдущей версии модели.
[Prompt 3/4] A group of young professionals at a rooftop networking event in a metropolitan city, wearing smart casual attire. They are holding cocktails and engaging in animated discussions with a skyline view in the background. pic.twitter.com/RK8J6UOial
— Artificial Analysis (@ArtificialAnlys) April 15, 2025
«Мы удвоили набор данных, используя парадигму обучения с учетом дефектов и двухосевую совместную структуру выборки данных», — отмечается в техническом описании модели. Среди других инноваций — новая парадигма ускорения, которая позволяет достичь 4-8-кратного ускорения при сохранении качества изображения.
Разработчики также отмечают способность Seedream 3.0 корректно отображать сложные типографические элементы, включая китайские иероглифы. Модель пока находится в закрытом бета-тестировании. Записаться на ранний доступ можно на сайте.
Читать далее:
Эйнштейн ошибся: возможно, пространства-времени вообще не существует
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Ученые в тупике: «Уэбб» засек невозможный свет в галактике
Иллюстрация на обложке: Изображение от freepik, сведения о лицензии