Искусственный интеллект научили имитировать человеческий голос

Ученые из Китая анонсировали технологию Deep Voice, которая работает на основе машинного обучения и с помощью коротких семплов способна обмануть систему распознавания голоса. Она тренировалась на основе звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Как рассказали разработчики, для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов.

Deep Voice способна имитировать тембр, интонацию голоса и делает их неотличимыми от настоящих. По мнению создателей, она может использоваться в роли цифровых помощников, в записи голоса для видеоигр, музыки и в синхронном переводе. Кроме того, она может служить тем, кто утратил возможность говорить. Ученые также отметили, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

«Это настоящий прорыв с технической точки зрения, — отметил один из авторов разработки Лео Зу. — Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями».

Google создал генератор речи, неотличимый от голоса человека

Это не первая инновация в этом направлении — канадские разработчики ранее презентовали голосовой сервис под названием Lyrebird. Он сжимает все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений всего за полсекунды. Он также способен копировать любые бытовые звуки — например, работающую бензопилу или пение конкретного вида птиц, может изображать сердитый, веселый или сочувствующий тон. Канадская разработка, также как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

Однако канадские и китайские разработчики отмечают, что у технологий есть общая проблема: им могут воспользоваться мошенники для того, чтобы вводить людей в заблуждение или воспользоваться возможностями программ, которые работают на основе распознавания речи. Юристы также отмечают, что в связи с этим опасаются, что в скором времени аудиозаписи будут менее значимым доказательством в судах.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости