Голосовой помощник работает благодаря технологиям распознавания и синтеза речи, сервиса принятия решений и преобразования его в голосовое сообщение. Разработки в сфере автоматизированных коммуникаций ведут крупнейшие ИТ-компании, и роботы с каждым днем становятся все умнее. Так, к 2025 году мировой рынок технологий распознавания речи должен превысить $30 млрд. К этому времени в мире, согласно прогнозам, будет работать более 8 млрд голосовых ассистентов (для сравнения, еще в 2018 году — 2,5 млрд). О том, на что способны сегодня голосовые помощники и какие трансформации ждут технологию впереди, рассказал Игорь Калинин, основатель компании TWIN.
Разговорный ИИ: вчера vs сегодня
На первый взгляд, технология разговорного ИИ проста. Вначале голосовой бот преобразовывает речь в текст, следом информация попадает в сервис принятия решений; затем выбранные данные преобразуются в голосовое сообщение (система называется ТТС) и далее передаются по телефону или другому каналу коммуникации. Дополнительно используются микросервисы — например, робот может распознавать некоторые эмоции — положительные, нейтральные и отрицательные — или гендер человека.
В развитии разговорного интеллекта особенно заинтересованы представители сразу нескольких сфер. Прежде всего, это контакт-центры: так, самый крупный рынок по применению NLU-алгоритмов (понимание естественного языка — «Хайтек»), по данным Everest Group, составляет $330 млрд в год. Другая область — производители домашних разговорных устройств (умные колонки, девайсы для авто, роботы). Особенно жесткая борьба в этой сфере развернулась в Китае — к 2018 году практически каждый из интернет-гигантов выпустил собственную умную колонку. И, конечно, развитие технологии необходимо для голосовых ассистентов.
Разговорный искусственный интеллект развивается в различных направлениях. Одна из самых перспективных технологий — это сервис распознавания эмоций. Изначально мы предполагали, что ИИ сможет распознавать относительно большой спектр эмоций (около 12), однако в итоге остановились на трех базовых: позитивном, негативном, нейтральном — эти настроения определяются с точностью до 95% (на разницу в несколько процентов чаще всего влияет качество связи). Ведь даже человек не всегда способен определить, например, грустит он или печалится. Компании внедряют подобные технологии не просто так: например, определяя негатив, робот может соединить клиента с оператором, чтобы раздражение не копилось, а конкретная задача решилась максимально быстро и эффективно.
Еще одно интересное направление развития технологий — распознавание гендера по голосу. Точность также достаточно высока — 98%. Зачем это нужно компаниям? Приведем пример: робот планирует пообщаться с конкретным клиентом — например, женщиной, и если трубку возьмет мужчина, он может попросить позвать к телефону другого человека. Персонализация в отношении клиентов — must have в 2020 году для любой компании.
Бот на проводе: зачем разговорный ИИ бренду
Технологии разговорного ИИ быстро развиваются — из 400 крупных компаний, работающих в самых разных отраслях, 91% уже серьезно инвестируют в это направление. Самые успешные компании — от Bosch до Starbucks — используют разработки на базе ИИ для общения с клиентами: на сайтах, в мессенджерах, мобильных приложениях и в других каналах коммуникации. Разговорный искусственный интеллект пригодится везде, где предусмотрены диалоги и их достаточно много. Интерес корпораций — в практической пользе голосовых помощников: с помощью технологии можно сократить расходы, увеличить прибыль и повысить эффективность работы.
Например, еще в 2017 году The Royal Bank of Scotland (Королевский банк Шотландии) запустил робота Luvo. С помощью распознавания речи он общается с клиентами банка и даже выполняет стандартные операции вроде денежных переводов. А в 2019 году организаторы двухдневной конференции для стартапов Slush в Хельсинки использовали разговорного бота для обработки сообщений участников мероприятия. Голосовой помощник Botzilla помог ответить на более чем 10 тыс. запросов в течение всего мероприятия и лишь 100 из них передал в службу поддержки.
Можно разработать бота внутри компании самостоятельно, а можно взять готовое решение. На рынке существует большое количество платформ, которые могут полностью подстраиваться под необходимый профиль компаний — например, полноценный виртуальный помощник, который способен принимать решения и вести общение через разные каналы коммуникации.
Разговорные боты также особенно полезны в тех нишах, где поток клиентов довольно большой. Это, к примеру, транспортно-логистические, e-commerce и страховые компании. Прежде всего, голосовой робот — хороший помощник на рынке сервисной технической поддержки или на рынке сопровождения. Еще одна сфера, которую мы выделили в компании, — линия первой поддержки (низкоквалифицированные специалисты, которые принимают звонки и отвечают на часто задаваемые вопросы) и лидогенерация.
По компетенции боты способны проявлять себя лучше, чем большинство операторов, но уступают амбассадорам, которые есть в любом call-центре. Условно call-центр можно поделить на четыре категории: Q4 (новые сотрудники, проходят адаптацию и обучение), Q3 (прошли испытательный срок, но большая часть продолжает приносить убыток из-за низкой производительности), Q2 (стабильные сотрудники, на которых можно положиться), Q1 (тянут весь call-центр). Бот не способен пока конкурировать с Q1, а с Q4 и Q3 — запросто. С Q2 конверсия робота и человека сопоставима, но есть разница в стоимости (бот в 3–5 раз дешевле).
Недавно к нам обратилось предприятие, которое за короткое время выросло в несколько раз за счет слияния. По итогу сотрудники перестали успевать обрабатывать более 1 млн входящих звонков ежемесячно. Возникала постоянная задержка — клиентам приходилось ждать ответа оператора более 15–20 минут. Решение, которое мы предложили, — настройка голосового бота для первой линии. Результат — в течение следующего месяца обращения клиентов стали обрабатываться с первой секунды разговора, а ожидание ответа снизилось до нуля даже в пиковое время.
Чат-боты также активно используются бизнесом — около 57% компаний доверяют некоторые задачи корпоративным ботам или планируют его настроить (как для B2B-, так и для B2C-целей). К примеру, эффективность такого помощника в МТС превышает 80%. Это означает, что 8 из 10 запросов решаются без привлечения оператора. Но разговорный искусственный интеллект еще эффективнее. Например, в банке «Тинькофф» работает голосовой помощник «Олег» (в области лайфстайла и финансов). В целом чат-боты учреждения без участия человека решают 35% всех обращений клиентов.
Бизнес также часто использует голосовых помощников не только для того, чтобы информировать и общаться с клиентами, но и планировать встречи. Например, для одной крупной американской компании, которая занимается недвижимостью, мы разработали умного бота. Его задача заключалась в «холодном» обзвоне клиентов по всем штатам США. Голосовой робот Philbot не только вел «живой диалог», но его голос полностью соответствовал американской речи, которая похожа на местную на 99,9%. Он обзванивал клиентов и во время общения, учитывая ценовое предпочтение, относил их к одной из четырех целевых групп. Если человеку было неудобно общаться по телефону, бот предлагал общение в соцсети — это позволило не терять лид.
Конверсия после обзвона составила 1%, что не отличалось от конверсии сотрудников при аналогичной работе. Но если люди справились бы с такой задачей за несколько дней, то бот способен сделать обзвон за один час. Это позволило быстро получить базу горячих лидов и зафиксировать различные триггеры, что упростило дальнейший анализ результатов звонков.
Как будут развиваться голосовые помощники в будущем
В 2020 году глобальный рынок интеллекта вступил в новую эру. Вопрос, является ли ИИ жизнеспособным, уже сменился на утверждение. Сейчас голосовые ассистенты развиваются в двух направлениях — это формализация для исполнения определенных задач и помощники для развлечения пользователей. Пока это умный генератор ответов для диалога, но придумывать шутки самостоятельно робот еще не способен.
Но ведь еще 30 лет назад люди пользовались справочником, чтобы найти какую-то информацию. Затем появились смартфоны, интернет. Голосовой интерфейс сайта придет им на смену. Я думаю, что в скором времени любую информацию можно будет получить с помощью голосового запроса, ответ на который будет максимально релевантным за счет персонализированного подхода голосового ассистента к каждому пользователю. Предполагаю, что индустрия будет расти даже не на 30% за год, а минимум в 2-3 раза.
Читайте также:
— Ледник «Судного дня» оказался опаснее, чем думали ученые. Рассказываем главное
— Появилось сразу два доказательства внеземной жизни. Одно на Венере, другое — неизвестно где
— На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком