Более 500 млн китайцев пользуются бесплатными услугами компании iFlytek, чтобы преобразовывать речь в текст, общаться с иностранцами или роботами. И чем больше примеров живых диалогов собирает стартап, тем лучше становятся его алгоритмы.
Когда житель Пекина Ган Сюй хочет обсудить со своим квартиросъемщиком из Канады квартплату или счет за электричество, он открывает приложение iFlytek Input и начинает говорить. Программа переводит устную речь в английский текст и отсылает адресату, ответ которого также переводится на китайский.
Подобным образом используют iFlytek Input более 500 миллионов человек в Китае. Некоторые наговаривают сообщения во время управления автомобилем или общаются с носителями других диалектов. Приложение было разработано китайской компанией iFlytek, специализирующейся на применении методов глубокого обучения для распознавания речи, машинного перевода и обработки больших данных.
Сюй не всегда может с первого раза донести свою мысль канадскому арендатору — приложение работает не идеально. Вот почему компания делает ставку на сбор и анализ как можно большего числа реальных диалогов. Приложение распространяется бесплатно и собирает данные с момента своего запуска, в 2010 году. А свободно распространяемая платформа iFlytek Open Platform предоставляет голосовые технологии более 400 тысячам разработчиков в различных отраслях промышленности, от мобильного интернета до умных домов, сообщает MIT Technology Review.
Найденный на Марсе бор — доказательство существования жизни на планете
Кейсы
В августе iFlytek выпустила голосового помощника «Сяофэйюй» («Летающая Рыбка»). Корпус, в котором он заключен, лишен кнопок и экрана, чтобы не отвлекать водителя от дороги. После подключения к смартфону и интернету, гаджет может совершать телефонные звонки, проигрывать музыку, подсказывать дорогу или подыскивать подходящий ресторан. В отличие от домашних колонок, «Сяофэйюй» умеет распознавать голос хозяина среди шума.
В больнице провинции Аньхой работают 10 девушек-роботов, оснащенных технологией распознавания речи iFlytek. Они встречают посетителей в фойе и облегчают работу загруженных администраторов. Больные могут рассказать роботам о своих симптомах, и их направят в нужное отделение. В 84% случаев андроиды не ошибаются.
Врачи этой клиники тоже используют iFlytek, чтобы надиктовывать сведения о пациентах, прописанное лечение и другую информацию на мобильное приложение, которое превращает голос в текст. Технология голосовой подписи защищает текст от фальсификации. Приложение также собирает данные, чтобы улучшать свои алгоритмы.
Перовскитный «брезент» — новая альтернатива солнечной черепице Tesla
Идеи
Компании, стоимость которой оценивается в 80 млрд юаней ($12 млн), не чужды международные амбиции, в частности, подразделение в США и расширение на другие языки, кроме китайского. А недавно она начала помогать шанхайской полиции расследовать преступления, изучая материалы уголовных дел, в которых могли вкрасться неточности.