Эксперты из Калифорнийского университета в Беркли разработали алгоритм обмана системы распознавания речи. Для этого достаточно зашифровать в аудиосигнале незаметные шумы, которые система примет за речь. При трансформации программа расшифрует фальшивую речь в текст. Скорость преобразования при этом доходит до 50 знаков в секунду.
Физики измерили «тень», которую отбрасывает четвертое измерение
Идеи
Свой алгоритм исследователи испытали на примере системы преобразования речи в текст DeepSpeech от Mozilla, которая доступна на GitHub. Исследователи зашифровали в аудиосигнале скрытое послание, и именно его распознала система. Специалисты заставили программу преобразовывать в желаемый текст даже музыку, которую DeepSpeech изначально не должна была воспринимать как речь. Добиться искажения удалось в 100% случаев.
Ранее те же исследователи нашли другой способ взлома голосовых помощников. Они придумали так называемые скрытые голосовые команды — шумы, которые виртуальные помощники принимали за текст. Однако такой системы вряд ли стали бы пользоваться злоумышленники — шумы были слишком заметными и звучали устрашающе.
Новая технология позволяет искажать речь незаметно. «В своей работе я хотел сделать потенциальную атаку более скрытой. С помощью новой методики я могу, например, взять видеоролик, добавить к нему немного вредоносных шумов, заново загрузить его — и система распознавания речи расшифрует его совсем иначе. При этом услышать искажения будет невозможно», — рассказал The Next Web один из экспертов Николас Карлини.
В перспективе ничто не помешает злоумышленникам зашифровать команду в рекламном ролике на ТВ или в популярной песне на радио, считает автор исследования. Технология в теории может позволить злоумышленникам контролировать виртуальные помощники, такие как Alexa или Siri.
Идея просто так раздавать деньги нравится уже почти всем
Технологии
Недавно эксперты Google разработали программу, которая с точностью имитирует человеческий голос. Tacotron 2 справляется с трудными для произношения словами и названиями, а также меняет интонацию в зависимости от пунктуации.