Учёные из AIRI, МТУСИ, Сбера и VeinCV представили метод, который мешает автоматическим системам собирать биометрические данные из открытых аудио. Технология уже принята к публикации на международной конференции Interspeech 2025.
Учёные из AIRI, МТУСИ, Сбера и VeinCV разработали способ блокировать несанкционированный сбор голосовой биометрии из открытых аудиофайлов. Технология основана на универсальных состязательных патчах (UAP) — специальной цифровой модификации, которую добавляют в аудиозапись до публикации.
Такой патч делает голосовую биометрию нераспознаваемой для алгоритмов, которые извлекают индивидуальные голосовые «отпечатки» (speaker embeddings). При этом звук остаётся разборчивым для человека и пригодным для автоматических систем расшифровки речи, перевода и поиска по ключевым словам. Новая функция потерь минимизирует искажения, сохраняя баланс между защитой и качеством.
Решение работает на аудиофайлах любой длины — от коротких фрагментов до длинных лекций. Оно особенно важно для публичных людей, контент-мейкеров, преподавателей, а также компаний, которые публикуют обучающие и корпоративные записи. Защита помогает избежать кражи голосовой идентичности, создания дипфейков и несанкционированного профилирования личности.
«Наша цель — усилить защиту цифрового следа человека, прежде всего — голосовой идентичности. Новая технология позволяет делиться аудиоконтентом без риска, что ваш голос попадёт в чужую биометрическую базу», — отметил Олег Рогов, к.ф.-м.н., руководитель научной группы AIRI и лаборатории безопасного ИИ SAIL AIRI–МТУСИ.
Исследование примут к публикации на конференции Interspeech 2025 в Роттердаме — одном из крупнейших мировых форумов по технологиям обработки речи (рейтинг Core-A).
Читать далее:
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Испытания ракеты Starship Илона Маска вновь закончились взрывом в небе
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Обложка: AI | freepik