Лет 10 назад нам приходилось по шесть раз повторять голосовому ассистенту свой вопрос. Сегодня же речевые технологии справляются со своей работой не хуже людей. И делают это очень убедительно! В 97% случаев те, кому звонят «интеллектуальные» виртуальные операторы, не понимают, что общаются с ботом. Сооснователь компании Fonemica Игорь Баско рассказал, насколько эффективны речевые технологии и к каким подводным камням при их внедрении нужно быть готовым.
Где применяются речевые технологии
Голосовые системы уже «говорят» от лица самых разных сфер: здравоохранения, образования, ЖКХ, энергетики, банковского сектора и многих других. Пользователи всё активнее покупают умные колонки. В США с 2018 по 2019 год спрос на них вырос на 40%, и сейчас там функционирует более 66 млн таких устройств. В Нидерландах умные колонки стали популярными всего за 4,5 месяца.
Компания Triad Health AI использует Google Home и Amazon Alexa при лечении болезни Паркинсона. Умные динамики помогают пациентам совмещать физические упражнения с базовыми когнитивными тестами, например, повторять числа или решать несложные математические уравнения. Британские машины скорой помощи оснащены колонками Amazon Alexa. По пути в больницу они помогают медработникам быстро найти информацию о лекарствах пациента и озвучивают ее через динамик, экономя бесценные секунды.
Novel Effect разработала технологию, которая сопровождает живые чтения звуковыми сценами, удерживая внимание читателя. Технологии голосовой связи интегрированы практически во все современные автомобили крупных производителей: от Mercedes-Benz и BMW до Tesla, Chevrolet и Ford.
Сферы применения речевых технологий можно долго перечислять. Они уже меняют нашу жизнь, а представьте, как они разовьются еще через 10 лет!
Зачем компаниям внедрять речевые технологии
К 2030 году искусственный интеллект (ИИ) должен увеличить глобальный ВВП на 14%. В России менее 10% крупных компаний уже используют эти технологии, остальные же планируют внедрить их в ближайшие год-два. Менее 15% отечественных компаний используют системы ИИ для интеллектуальной обработки данных, а 60% представителей бизнеса рассматривают применение их в бизнес-процессах, связанных с обслуживанием клиентов.
Особенно активно речевую аналитику используют в колл-центрах. Голосовые технологии призваны контролировать и повышать качество сервиса, оптимизировать процессы и следить за соблюдением корпоративных стандартов и повышением продаж.
Например, можно быстро и детально анализировать записи разговоров и отслеживать, насколько корректно и доброжелательно сотрудник общается с клиентом, чем чаще бывают недовольны клиенты, какие вопросы популярнее, насколько быстро и эффективно решается проблема.
По нашим данным, речевые технологии могут повысить продажи от 16 до 25% независимо от товара или услуги.
В ритейле для такого анализа часто используется диктофон-бейдж. Он записывает диалоги сотрудников и клиентов, а все дорожки автоматически передаются на платформу для распознавания и аналитики. Умный бейдж ведет запись в режиме стерео, чтобы речь сотрудников и клиентов можно было анализировать по отдельности. Например, можно выявить основные тематики обращений клиентов и наиболее успешные сценарии диалогов, приводящие к продаже.
Согласно нашим данным, диктофон-бейдж помогает сделать общение сотрудника с клиентом более эффективным и повысить продажи в среднем на 18%.
В развитии инструментов распознавания речи заинтересованы не только колл-центры крупных компаний. Например, формируется глобальный запрос на голосовую аутентификацию в финансовых организациях, учреждениях из сферы здравоохранения и в госсекторе. Крупнейшим банкам Великобритании HSBC и Barclays это помогло сократить время узнавания клиентов с 1,5 минут до 10 секунд.
Также популярность набирают умные голосовые боты. При автоматизации входящих и исходящих звонков «интеллектуальный» бот практически полностью заменяет человека: подстраивается под эмоции, контекст, может вести сложные диалоги. Голосовой чат-бот использует синтез речи или предварительно записанные текстовые и речевые ответы. Иногда он жонглирует ими настолько искусно, что среднестатистическому человеку очень сложно распознать в собеседнике робота.
Одним из наших кейсов был бот-коллектор. Он должен был обзванивать базы должников, выяснять причины просрочки и мотивировать абонентов на погашение. В итоге 96% респондентов не догадались, что говорят с роботом, а банк не получил ни одной жалобы со стороны потребителей. При этом коэффициент конверсии в целевое действие в виде согласия на внесение очередного платежа был очень близок к общению с реальным оператором.
Стоимость звонка такого бота в 2-3 раза ниже, чем в случае с живым оператором. По нашему и международному опыту коллег, боты могут заменить до 30% ежедневных рутинных операций сотрудников колл-центра.
Согласно отчету MarketsandMarkets, мировой рынок технологий для распознавания речи вырастет до $12 млрд к 2022 году. А к 2025 году, согласно прогнозам, он достигнет $26,15 млрд.
Преимущества и недостатки речевых технологий
Системы на базе ИИ работают в сотни раз быстрее, чем человек, однако эта скорость зависит от вычислительных мощностей. При этом речевые технологии обходятся компании дешевле человеческого труда: 1 бот способен заменить 100 операторов.
Стоит упомянуть и скорость разворачивания. Если в преддверии незапланированной акции вам нужно обзвонить за неделю несколько миллионов человек, а сотрудников слишком мало — например, у вас период праздников или акций. Вы не сможете оперативно нанять и обучить такое количество человек — за дело может взяться бот. Голосовые ассистенты совершают до 1 млн звонков в день и не тратят время на обед или кофе, они всегда в режиме боевой готовности.
Для сравнения: компания Clarity International проводила международное исследование среди руководителей контакт-центров и выяснила, что в среднем каждая компания тратит 7 месяцев на поиск, наем и обучение персонала этих центров. Голосовой бот же может быть готов к полноценной работе и масштабированию за несколько дней.
По статистике, ИИ уже занимает весомую долю в процессах многих зарубежных компаний, что приводит к оптимизации рутинных процессов и численности персонала для этих нужд. Amazon уже использует на складах роботов без использования человеческих ресурсов. С помощью речевых технологий удается оптимизировать существенные расходы на отделы контроля качества, клиентский сервис, тайного покупателя, тренинги, а также освободить время руководителей, HR на мониторинг и контроль персонала. Сейчас существенную долю этих задач могут взять на себя современные речевые технологии, в том числе совместно с другими внедряемыми решениями ИИ.
Текущая ситуация с карантином показала неготовность бизнеса к резкому переформатированию. Задача ИИ — ускорить процесс цифровизации и решить проблему трансформации. Например, мы все стали свидетелями востребованности облачных сервисов, которые помогают нам дистанционно общаться. При этом применение речевых технологий позволяет анализировать разговоры как по обычному телефону, так и по мобильному. Тренд будущего — облачные АТС, а также программы по типу Teams, Skype, Zoom, Google Meets и другие.
Что дальше? Теперь перед государством и бизнесом встала задача оптимизации ресурсов, особенно трудовых. 30% компаний по всему миру уже объявило о сокращении штата и зарплат. Всем нам хорошо известно, что в кризис нельзя останавливать производство товаров и услуги. Яркий пример последствий — Великая депрессия в США или же кризис после распада СССР.
Очевидно, что мир уже не вернется к прежнему состоянию и мы научимся жить в новой парадигме. Исторически основной задачей ИИ было сокращение использования человеческих ресурсов. Текущая ситуация только ускорила этот процесс, при этом довольно болезненно.
Мы увидим смену условий труда, форму компенсаций, будут пересмотрены все правила игры. На смену придет ИИ, часть процессов будут автоматизированы полностью.
По наблюдению ряда консалтинговых компаний, российский бизнес с трудом принимал решение о сокращении персонала из-за внедрения ИИ, это сложный моральный выбор. Сейчас всё может измениться.
Во сколько обходятся голосовые технологии
Стоимость внедрения зависит от продукта и размера компании. Технологии существуют в двух видах: облачной и on-premise (локальное ПО на предприятии — «Хайтек»). Большинство B2B-компаний по всему миру предпочитают работать с облаком, ведь его можно быстро внедрить без больших инвестиций. В речевых технологиях тарификация измеряется в минутах, порог входа — от 10 тыс. рублей в месяц. Компании, который имеют высокую чувствительность к персональным данным, например, банки, часто используют решения on-premise (работающие в закрытом контуре заказчика на его серверах).
Что ждет рынок дальше
Российские компании понимают, что речевые технологии позволят им оптимизировать затраты на организацию и обработку звонков, справиться с пиковыми нагрузками и улучшить качество сервиса.
Например, «Билайн» уже несколько лет применяет ИИ для ряда внутренних и внешних операций. Звонки сервисных подразделений, совершаемые по стационарным и мобильным телефонам, анализируются с помощью систем распознавания речи и речевой аналитики. Компания давно практикует удаленный режим работы сотрудников (технология BeeFREE), и пандемия мало что поменяла. Общение с клиентами перешло в облачные АТС и корпоративные интернет-сервисы — как Zoom и Skype for Business. У руководства компании всегда есть полная картина деятельности каждого сотрудника.
Mail.ru Group развивает собственные системы распознавания и синтеза речи вместе с диалоговым движком. Самый заметный пример — это голосовой помощник «Маруся».
В ближайшие годы российский сегмент совершит сильный скачок в области развития речевых технологий. Бизнес уже понял, что голосовые инструменты оказываются не только дешевле, но и эффективнее. Они активно участвуют в развитии компаний и заодно формируют новые рыночные ниши для бизнеса.
Читайте также:
— Ученые создали резину, которая может самостоятельно восстанавливаться
— Ученые создали эффективную систему передачи энергии на расстоянии
— Даже слабый ветер делает социальное дистанцирование бесполезным