«Ну как бы э-э-э»: почему Google Duplex — не прорыв

На прошедшей в начале мая конференции Google I/O 2018 фурор произвела Duplex — экспериментальная технология, которая позволяет боту с AI совершать голосовые звонки. Да, все видели, как Duplex позвонил в парикмахерскую от имени клиента. Да, в формате презентации это было удивительно. Да, многим показалось, что Google ушла далеко вперед в плане искусственного интеллекта и обработки естественного языка. IT-евангелист SuperJob Алиса Беркана объясняет, почему Google Duplex — просто еще одна нейросеть в хорошей «упаковке».

Благодаря WaveNet, генераторной программе на основе искусственного интеллекта, Duplex больше, чем другие голосовые помощники, напоминает человека. Синтезированные голоса звучат необычайно естественно, несмотря на то что генерируются из склеенных фрагментов речи (так устроен весь современный синтез речи).

Одно из новшеств — слова-наполнители, такие как «хммм» и «понятно», которые Duplex вставляет во время пауз. Человеческая речь всегда включает паузы, колебания и повторы, а без них звучит жутко, — мы подсознательно ожидаем, что человек на том конце провода не сидит со словарем Розенталя в руках и допустит хотя бы какую-нибудь ошибку.

Например, для записи в салон красоты помощнику нужно предоставить ключевые параметры — название салона и время, которое вы хотите забронировать. Помощник проверит ваше расписание, и если желаемое время уже занято, предложит другое. Если у салона есть услуга онлайн-бронирования, Duplex воспользуется ею, если нет — сделает телефонный звонок. После завершения бронирования запись о нем появится в календаре.

Почему Duplex хайпа поднятого не стоит

В преддверии своего 20-летия Google переходит от стратегии «сначала мобайл» к стратегии «сначала AI». Google Research даже изменила свое название на Google AI. Количество продуктов, управляемых искусственным интеллектом, растет. Но не нужно ставить Google на цифровой пьедестал.

Компания действительно научилась распознавать стандартный вопрос пользователя и выдавать из базы готовый ответ. Но вряд ли Duplex будет массово использоваться для тех задач, на которых его демонстрировали. Google сделал систему распознавания и синтезирования речи, а вот сам искусственный интеллект, который будет с этой системой работать, нам всем придётся изобретать самим.

Потому что за естественно звучащим синтезированным голосом нет интеллекта. В основе алгоритма — рекуррентная нейронная сеть, в которой связи между элементами образуют направленную последовательность. Любой, кто ждет от нейронки здравого смысла, а от Duplex — интеллекта, разочаруется: воспроизведение естественной человеческой речи основано на вычислении.

Google утверждает, что Duplex может совершать неконтролируемые звонки, разговаривать с людьми и выполнять задачи по настраиваемым сценариям, — но он предназначен для задач, в которых шанс, что все пойдет не так, минимален, и разговоры на отвлеченные темы поддержать не может.

Да, алгоритм достаточно умен, чтобы понять, что терпит неудачу в коммуникации, и если разговор зайдет в тупик, продолжить беседу придется человеку. Ответить на звонок надоедливой троюродной сестры из Сыктывкара, симулируя интерес к сплетням про родственников, Duplex не сможет.

Google использует встроенные «нууу» и «как бы», чтобы обмануть слушателя, маскируя неидеальность голосового синтеза «человекоподобным» контентом. Но само по себе это не новость: например, соискателям в SuperJob давно отвечает на письма робот, мастерски умеющий ставить смайлики. Да и стоит ли вообще пытаться обманывать пользователей? Скорее всего, сам факт общения с роботом уже скоро ни у кого не вызовет негативных эмоций — в отличие от попыток выдать его за живого собеседника.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости