Китайская компания Sogou создала аватаров китайских писателей, которые будут озвучивать аудиокниги. По данным «Би-би-си», Sogou использовала искусственный интеллект, технологии преобразования текста в речь и видеоклипы конференции China Online Literature+.
Хотя технология преобразования текста в речь позволяет быстро создавать новые аудиокниги, «Би-би-си» утверждает, что потребители предпочитают продукты авторов, актеров или известных общественных деятелей, которые они озвучивают сами. С ИИ Sogou сможет имитировать речь, которая похожа на голоса знаменитостей, создавая иллюзию того, что аудиокниги читают реальные люди.
Ведущие новостей ИИ компании Sogou выходят в эфир с осени прошлого года, работая на государственное информационное агентство Китая «Синьхуа». Хотя их представляли как «реалистичные и основанные на голосах реальных людей», большинству зрителей очевидно, что выражения лица и движения рта синтезированы с помощью методов глубокого обучения, отмечают авторы «Би-би-си». При этом трудно сказать, станут ли дикторы аудиокниг более реалистичными, чем ведущие.