Канадский ИИ-стартап Lyrebird опубликовал свой первый продукт – набор алгоритмов, которые могут сымитировать голос любого человека. В компании говорят, что достаточно звукового файла длинной 1 минута, чтобы обучить ИИ чужому голосу.
Несколько лет назад это было невозможно, но с того времени машинное обучение доказало, что идеально подходит для подобных задач. Машинный голос больше не ассоциируется с Сэмом из старых версий Windows, теперь это более похоже на людские голоса: помощники от Google, Apple или Amazon. Сегодня ИИ смог заговорить по-человечески, но прошло не так много времени, и он смог говорить голосом любого человека.
Недавно Adobe рассказала о проекте VoСo — программа, которая позволяет работать с голосовыми файлами так же, как Photoshop позволяет работать с фотографиями. В случае с VoCo для воссоздания чужого голоса требуется не менее 20 минут записей. Алгоритмы Lyrebird работают совершенно иначе. Для «воровства» чужого голоса программе нужна запись не более 1 минуты. ИИ изучит ее, учтет все особенности говорящего и перенесет их на себя.
Электросамолет вертикального взлета и посадки совершил первый полет
Идеи
В текущей версии программы можно достаточно быстро отличить воссозданный голос от оригинального, но схожесть точно есть. Учитывая, что уже сейчас голоса очень похожи, нет сомнений, что в будущих версиях программы отличить робота от оригинала будет все сложнее. Для демонстрации возможностей компания выложила беседу искусственных Обамы, Трампа и Клинтон.
В Lyrebird говорят, что могут не только воссоздать чужой голос, но и окрасить его эмоционально. Алгоритм может менять голос на сердитый, веселый, грустный. Создатели говорят, что в первую очередь это будет полезно для озвучивания текста голосами известных людей, для совершенствования работы голосовых ассистентов и прочих безобидных применений. Но очевидно, что перед массовым запуском создатели столкнутся с этическими проблемами подделки чужого голоса.
«Для искусственного интеллекта люди будут подобны муравьям»
Мнения
Аудиозаписи часто используются в качестве доказательств в суде. Существуют системы голосовой идентификации, и подделка голоса позволит легко их обманывать.
Развитие компьютерной графики, монтажа и нейронных сетей позволило воссоздавать реальных людей на экране и манипулировать ими. Добавим к этому «настоящие» голоса героев, и получится совсем дикая смесь — подделка политиков и публичных персон для создания вирусного контент встанет на поток.
Физики создали вещество с отрицательной массой
Идеи
Учитывая, что многие вопросы дипломаты и политики по-прежнему решают по телефону, это еще одна область, где можно создать неудобства. На эти заявления в компании отвечают обещанием выложить технологию в открытый доступ. Якобы, зная о ее существовании, все будут более внимательно относиться к вербальному формату общения.