ИИ Alibaba создает реалистичные видео по одной фотографии

Китайская технологическая компания представила ИИ Emote Portrait Alive — EMO.

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.

Демонстрация возможностей EMO

Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется  диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.


Читать далее:

Почему у людей нет хвостов: ученые наконец-то нашли ответ

Астрономы изучили радиоджет, который движется быстрее скорости света

Новый ИИ создает изображения в 8 раз быстрее, чем инструмент OpenAI

Изображение на обложке: @RINKIGroup

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Метеорит впервые зафиксировали на видео и со звуком удара о землю
Новости
Россияне жалуются на сбои в работе eSIM и SIM-карт в iPhone: что происходит
Новости
Ученые обнаружили новый тип планет: как они устроены
Новости
Названа самая частая причина «развода» пингвинов
Новости
Эта частица станет ключом к разгадке темной материи во Вселенной  
Новости
Названы последствия саботажа трубопровода «Северный поток» в Балтике
Новости
Ученые придумали, как создать более емкие и долговечные аккумуляторы
Новости
Анализ подтверждает гипотезу, что Луна «откололась» от Земли
Космос
Инженеры «связали» прочную кольчугу толщиной в несколько атомов
Наука
«Хаббл» за 10 лет создал крупнейшую панораму соседней галактики
Космос
В ОАЭ построят крупнейшую круглосуточную солнечную электростанцию
Новости
Астрофизики рассмотрели детали активного ядра галактики
Космос
Камера, которая имитирует глаз насекомого, снимает в полумраке 9120 кадров в секунду
Новости
Найдена огромная черная дыра, которая стреляет энергией в сторону Земли
Новости
Выяснилось, когда и откуда во Вселенной появилась вода на самом деле
Новости
Инженеры придумали, как управлять приложениями с помощью ног
Новости
Найден странный источник радиосигналов, которого «не может быть»
Космос
Что будет, если ежедневно пить один бокал пива или вина — исследование
Наука
Посмотрите на взрыв корабля Starship в небе: в чем причина аварии
Космос
ИИ в e-commerce: как он работает и как его правильно использовать
Мнения