«Ну как бы э-э-э»: почему Google Duplex — не прорыв

На прошедшей в начале мая конференции Google I/O 2018 фурор произвела Duplex — экспериментальная технология, которая позволяет боту с AI совершать голосовые звонки. Да, все видели, как Duplex позвонил в парикмахерскую от имени клиента. Да, в формате презентации это было удивительно. Да, многим показалось, что Google ушла далеко вперед в плане искусственного интеллекта и обработки естественного языка. IT-евангелист SuperJob Алиса Беркана объясняет, почему Google Duplex — просто еще одна нейросеть в хорошей «упаковке».

Благодаря WaveNet, генераторной программе на основе искусственного интеллекта, Duplex больше, чем другие голосовые помощники, напоминает человека. Синтезированные голоса звучат необычайно естественно, несмотря на то что генерируются из склеенных фрагментов речи (так устроен весь современный синтез речи).

Одно из новшеств — слова-наполнители, такие как «хммм» и «понятно», которые Duplex вставляет во время пауз. Человеческая речь всегда включает паузы, колебания и повторы, а без них звучит жутко, — мы подсознательно ожидаем, что человек на том конце провода не сидит со словарем Розенталя в руках и допустит хотя бы какую-нибудь ошибку.

Например, для записи в салон красоты помощнику нужно предоставить ключевые параметры — название салона и время, которое вы хотите забронировать. Помощник проверит ваше расписание, и если желаемое время уже занято, предложит другое. Если у салона есть услуга онлайн-бронирования, Duplex воспользуется ею, если нет — сделает телефонный звонок. После завершения бронирования запись о нем появится в календаре.

Почему Duplex хайпа поднятого не стоит

В преддверии своего 20-летия Google переходит от стратегии «сначала мобайл» к стратегии «сначала AI». Google Research даже изменила свое название на Google AI. Количество продуктов, управляемых искусственным интеллектом, растет. Но не нужно ставить Google на цифровой пьедестал.

Компания действительно научилась распознавать стандартный вопрос пользователя и выдавать из базы готовый ответ. Но вряд ли Duplex будет массово использоваться для тех задач, на которых его демонстрировали. Google сделал систему распознавания и синтезирования речи, а вот сам искусственный интеллект, который будет с этой системой работать, нам всем придётся изобретать самим.

Потому что за естественно звучащим синтезированным голосом нет интеллекта. В основе алгоритма — рекуррентная нейронная сеть, в которой связи между элементами образуют направленную последовательность. Любой, кто ждет от нейронки здравого смысла, а от Duplex — интеллекта, разочаруется: воспроизведение естественной человеческой речи основано на вычислении.

Google утверждает, что Duplex может совершать неконтролируемые звонки, разговаривать с людьми и выполнять задачи по настраиваемым сценариям, — но он предназначен для задач, в которых шанс, что все пойдет не так, минимален, и разговоры на отвлеченные темы поддержать не может.

Да, алгоритм достаточно умен, чтобы понять, что терпит неудачу в коммуникации, и если разговор зайдет в тупик, продолжить беседу придется человеку. Ответить на звонок надоедливой троюродной сестры из Сыктывкара, симулируя интерес к сплетням про родственников, Duplex не сможет.

Google использует встроенные «нууу» и «как бы», чтобы обмануть слушателя, маскируя неидеальность голосового синтеза «человекоподобным» контентом. Но само по себе это не новость: например, соискателям в SuperJob давно отвечает на письма робот, мастерски умеющий ставить смайлики. Да и стоит ли вообще пытаться обманывать пользователей? Скорее всего, сам факт общения с роботом уже скоро ни у кого не вызовет негативных эмоций — в отличие от попыток выдать его за живого собеседника.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Путин подписал закон против кибермошенничества: что изменится для россиян
Новости
Генератор изображений OpenAI теперь доступен бесплатно, но с ограничениями  
Новости
Apple готовит iOS 19: какие iPhone не получится обновить  
Новости
ЦЕРН представил проект нового коллайдера: что известно прямо сейчас
Наука
На «Госуслугах» запустили сервис для проверки сим-карт: как он работает  
Новости
В России введут маркировку электроники: это изменится для покупателей
Новости
Разработан мозговой имплант, который переводит мысли в речь почти мгновенно
Новости
«Хаббл» зафиксировал драматические сезонные изменения в атмосфере Урана
Космос
Физики МГУ придумали, как ускорить память компьютера терагерцовым излучением
Новости
Клетки жажды: нейробиологи выяснили, как мозг решает, когда нужно пить и есть
Наука
Разработчик ChatGPT анонсировал первую за пять лет модель с открытым кодом
Новости
«Казнить нельзя помиловать»: запятые и точки влияют на точность работы ИИ
Новости
Живые клетки обрабатывают информацию в миллиарды раз быстрее, чем считалось ранее
Наука
Яндекс опубликовал нейросеть YandexGPT 5 Lite в открытом доступе
Новости
Эксперты обсудили управление персоналом в эпоху цифровых технологий
Новости
Роспотребнадзор опроверг информацию о новом опасном вирусе в России
Новости
Последствия невесомости для скелета изучили на мышах-космонавтах
Космос
Томские химики создали экономичные катализаторы для зеленой промышленности
Наука
Ученые создали перчатку, с которой можно «ощущать» объекты в виртуальной реальности
Наука
Ученые в тупике: «Уэбб» засек невозможный свет в галактике
Космос