ИИ Alibaba создает реалистичные видео по одной фотографии

Китайская технологическая компания представила ИИ Emote Portrait Alive — EMO.

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.

Демонстрация возможностей EMO

Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется  диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.


Читать далее:

Почему у людей нет хвостов: ученые наконец-то нашли ответ

Астрономы изучили радиоджет, который движется быстрее скорости света

Новый ИИ создает изображения в 8 раз быстрее, чем инструмент OpenAI

Изображение на обложке: @RINKIGroup

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Силикон сделали проводником и заставили сиять: это считалось невозможным
Наука
Разработаны контактные линзы ночного зрения: они позволяют видеть в темноте
Наука
Китайские роботы показали боевые навыки перед первым турниром по робобоксу
Новости
«Нежелательные колебания атомов» использовали для хранения информации
Наука
Тайны Иерусалима: под полом древнего здания нашли золотые драгоценности 
Наука
Microsoft добавила ИИ в «Блокнот» и Paint: что умеют новые функции в Windows 11
Новости
В России научились собирать беспилотники с помощью цифрового помощника
Наука
Пять планет можно увидеть невооружённым глазом в июне: где и когда смотреть в России
Космос
Частная космическая компания проведет стыковку спутников на орбите
Космос
Черные дыры могут незаметно расти внутри звезд, считают астрофизики
Космос
Раскрыто происхождение зубной боли: чувствительность зародилась в панцире древних рыб
Наука
В сети нашли базу с паролями от 184 млн аккаунтов, включая Google, Apple и Meta*
Новости
Физики объяснили, как звуковые удары от самолетов попадают в помещения
Наука
Астрономы наблюдали жесткую космическую «битву» двух галактик
Космос
Новая система от Google распознает контент, который сделал ИИ
Новости
Приехали: почему россияне пересаживаются с прокатных на личные электросамокаты
Новости
Очередные тарифы Трампа сломают интернет: что нас ждет
Новости
За мигрантами в Москве будут следить через смартфоны: как работает эксперимент
Новости
Нейросеть, которая ускоряет разработку лекарств, сделали в России
Наука
Российский аналог Raspberry Pi на процессоре СКИФ создали в Новосибирске
Новости