ИИ Alibaba создает реалистичные видео по одной фотографии

Китайская технологическая компания представила ИИ Emote Portrait Alive — EMO.

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.

Демонстрация возможностей EMO

Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется  диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.


Читать далее:

Почему у людей нет хвостов: ученые наконец-то нашли ответ

Астрономы изучили радиоджет, который движется быстрее скорости света

Новый ИИ создает изображения в 8 раз быстрее, чем инструмент OpenAI

Изображение на обложке: @RINKIGroup

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Забота об экологии и цифровой мир: какой софт помогает заботиться об окружающей среде?
Мнения
«Уэбб» поймал самое старое слияние черных дыр: через 740 млн лет после Большого взрыва
Космос
Искусственный интеллект научили распознавать сарказм
Новости
«Хаббл» показал галактику странной формы в высоком разрешении
Космос
Оказалось, «сбой» в теории Эйнштейна может объяснить нашу Вселенную
Космос
Фото природной аномалии из космоса опубликовал американский астронавт
Космос
«Хаббл» показал, как свет трех звезд разрывает туманность
Космос
Суперточный робот прооперировал зерно кукурузы: эксперимент показали на видео
Новости
Наводнение в Бразилии показали из космоса: как оно выглядит
Космос
Посмотрите на фото северного сияния в 150 мегапикселей
Космос
Посмотрите на крошечную луну Юпитера: обычно ее не разглядеть
Космос
Ученые создали робота, который двигается, как улитка
Новости
Стартовал прием заявок на студкемп Яндекса по математике в ИИ
Новости
Супер-ИИ для учебы и поддержки, нейросеть для творчества, поиск по видео и мощный процессор — главное с Google I/O
Кейсы
По соседству с нашей галактикой нашли три старейшие звезды: откуда они появились
Космос
Посмотрите на астероид, который пролетел очень близко к Земле
Космос
Рядом с нами нашли планету размером с Землю: год там длится 17 часов
Космос
Загадочную аномалию нашли у пирамид Гизы: ученые не знают, что это
Наука
Минздрав уточнил информацию о «запрещенных» для водителей препаратах
Наука
Второй суперкомпьютер преодолел экзофлопсный барьер
Новости