Google обновила модель генерации видео — теперь Veo 3.1 умеет не просто визуализировать сцену, но и добавлять реалистичное аудио. Модель точнее реагирует на запросы и доступна в ряде продуктов Google — от Flow до Gemini и Vertex AI.
Google представила новую версию своей ИИ-модели для генерации видео — Veo 3.1. Эта версия умеет не только создавать изображение, но и добавлять к нему звук: эффекты, атмосферу, голос.
В Veo 3.1 улучшили соответствие видео текстовым подсказкам: модель точнее «понимает», что хочет пользователь.
Добавили инструмент Scene Extension — можно продолжить существующее видео, опираясь на последние кадры.
В Flow и Gemini пользователи смогут удалять объекты из сцены — модель заново «дорисует» фон.
Veo 3.1 будет работать в редакторе Flow, в приложении Gemini, через Gemini API и на платформе Vertex AI.
С момента запуска Flow (в мае) пользователи создали более 275 млн видеороликов через Veo.
По словам Google, ролики с новой моделью выглядят «живее» — изображения, движения и звук уже не ощущаются разрозненно.
Читать далее:
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Испытания ракеты Starship Илона Маска вновь закончились взрывом в небе
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Обложка: Google