ИИ, копирующий голос, оказался слишком хорош: OpenAI оценивает риски запуска

Предварительное тестирование Voice Engine — генератора голоса от разработчиков ChatGPT — показало, что модели достаточно 15-секундной записи для копирования голоса человека.

OpenAI представила результаты ограниченного тестирования модели Voice Engine, которая генерирует реалистичную запись голоса на основе небольшого фрагмента. Результаты показывают многообещающие примеры использования новой технологии, но в компании обеспокоены потенциальными проблемами с безопасностью.

Voice Engine создает синтетический голос на основе 15-секундного фрагмента записи чьей-либо речи. Голос, сгенерированный ИИ и очень близкий к оригиналу, может зачитывать любой текст, как на языке спикера, так и используя другие языки. OpenAI предоставила доступ к модели нескольким компаниям партнерам для тестирования возможностей ИИ при решении реальных задач.

Например, Age of Learning использовала Voice Engine для создания закадрового контента для учебных материалов и предоставления учителям персонализированных устных ответов для взаимодействия с учениками. А HeyGen переводит рекламные видео и демонстрации продуктов для вывода товаров на новые рынки. При этом в процессе перевода сохраняется стиль речи и акцент спикера.

Также в тестировании участвовала компания Livox, которая разработала приложения для людей с проблемами речи. Voice Engine позволяет пользователям генерировать голос на основе текста и выбирать голос, который лучше всего их представляет. А Lifespan запустила пилотную программу, позволяющую людям с нарушениями речи из-за рака или неврологических заболеваний общаться с помощью ИИ.

Представители OpenAI заявили, что их впечатлили варианты использования, предложенные участниками тестирования. Но необходимо принять дополнительные меры безопасности, прежде чем компания примет решение о том, «можно ли и как развертывать эту технологию в больших масштабах».

Партнеры, допущенные к тестированию подписали соглашения, которое обязывает явным образом информировать пользователей об использовании искусственно сгенерированного контента. Кроме того, Voice Engine внедряет в звуковые файлы специальную метку (водяные знаки), которая позволяет отследить происхождение и распространение контента.

Тем не менее в компании полагают, что перед внедрением технологии нужно проработать дополнительные меры, которые ограничат незаконное использование подобных моделей. Например, необходимо создать «стоп-лист» голосов известных людей, которые модель не будет генерировать, чтобы припятствовать распространению дип-фейков.

Одновременно OpenAI объявила об отмене требования о регистрации для использования наиболее известного своего продукта — языковой модели ChatGPT. Теперь для использования чат-бота необязательно заводить персональный аккаунт.


Читать далее:

Ученые создали первый в мире алмазный транзистор: он работает при самых высоких температурах

Крупнейшее извержение вулкана за 11 700 лет покрыло лавой 4 500 км²

Ученые рассмотрели, что происходит в центре нашей галактики

На обложке: Изображение от rawpixel.com на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос
ИИ научился предсказывать успеваемость студентов по данным профиля в VK
Новости
Странная звезда Млечного Пути пульсирует каждые 44 минуты и это не объяснить
Космос
Этот OLED-экран сам издает звук: каждый пиксель работает как динамик
Новости