Нейросеть научилась реалистично имитировать звуки

Искусственный интеллект готов потеснить даже шумовиков - специалистов, которые записывают шумовые эффекты для кино и видеороликов. Разработанная учеными из МТИ нейросеть самостоятельно записала к беззвучному видео подходящие аудиодорожки и прошла звуковой тест Тьюринга - люди не смогли отличить синтезированные звуки от настоящих. О разработке пишет Engadget.

Ученые из лаборатории компьютерных наук и ИИ (CSAIL) записали видеоролики, на которых они ударяют барабанной палочкой по различным предметам, включая кусты, заборы и металлические решетки. Всего было подготовлено 978 видеороликов, на которых выполнялось 46620 различных действий. Все эти данные были предоставлены алгоритму на основе глубокого машинного обучения.

Разработанная в МТИ нейросеть самостоятельно определяет, как звук соотносится с визуальным рядом и составляет конкретные паттерны. ИИ успешно может отличить постукивание по камням от постукивания по листьям или по диванной подушке. Он также в 67% случаев отличает мягкий предмет от твердого.

Как только алгоритму демонстрируют новое видео уже без звука, он оценивает каждый отдельный кадр видеоролика и сопоставляет аудиодорожку с базой данных (она получила ироничное название Greatest Hits). После этого компьютер генерирует звуки для видео, причем синтезирует их самостоятельно, а не берет из базы данных.

Ученые проверили, сможет ли алгоритм обмануть человека. Они провели онлайн-исследование и попросили респондентов определить, реален ли звук на видео. Аудио, сгенерированное искусственным интеллектом, казалось участникам опроса реальным в два раза чаще, чем оригинальная звуковая дорожка.

Алгоритм пока нельзя назвать совершенным: он еще не отличает настоящий удар по предмету на видео от имитации удара, а также не может воспринимать звуки в отрыве от визуального ряда. Однако ученые из МТИ считают, что это только начало, и скоро ИИ смогут действовать так же эффективно, как и профессиональные шумовики.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости