Когда житель Пекина Ган Сюй хочет обсудить со своим квартиросъемщиком из Канады квартплату или счет за электричество, он открывает приложение iFlytek Input и начинает говорить. Программа переводит устную речь в английский текст и отсылает адресату, ответ которого также переводится на китайский.
Подобным образом используют iFlytek Input более 500 миллионов человек в Китае. Некоторые наговаривают сообщения во время управления автомобилем или общаются с носителями других диалектов. Приложение было разработано китайской компанией iFlytek, специализирующейся на применении методов глубокого обучения для распознавания речи, машинного перевода и обработки больших данных.
Сюй не всегда может с первого раза донести свою мысль канадскому арендатору — приложение работает не идеально. Вот почему компания делает ставку на сбор и анализ как можно большего числа реальных диалогов. Приложение распространяется бесплатно и собирает данные с момента своего запуска, в 2010 году. А свободно распространяемая платформа iFlytek Open Platform предоставляет голосовые технологии более 400 тысячам разработчиков в различных отраслях промышленности, от мобильного интернета до умных домов, сообщает MIT Technology Review.
Найденный на Марсе бор — доказательство существования жизни на планете
Кейсы
В августе iFlytek выпустила голосового помощника «Сяофэйюй» («Летающая Рыбка»). Корпус, в котором он заключен, лишен кнопок и экрана, чтобы не отвлекать водителя от дороги. После подключения к смартфону и интернету, гаджет может совершать телефонные звонки, проигрывать музыку, подсказывать дорогу или подыскивать подходящий ресторан. В отличие от домашних колонок, «Сяофэйюй» умеет распознавать голос хозяина среди шума.
В больнице провинции Аньхой работают 10 девушек-роботов, оснащенных технологией распознавания речи iFlytek. Они встречают посетителей в фойе и облегчают работу загруженных администраторов. Больные могут рассказать роботам о своих симптомах, и их направят в нужное отделение. В 84% случаев андроиды не ошибаются.
Врачи этой клиники тоже используют iFlytek, чтобы надиктовывать сведения о пациентах, прописанное лечение и другую информацию на мобильное приложение, которое превращает голос в текст. Технология голосовой подписи защищает текст от фальсификации. Приложение также собирает данные, чтобы улучшать свои алгоритмы.
Перовскитный «брезент» — новая альтернатива солнечной черепице Tesla
Идеи
Компании, стоимость которой оценивается в 80 млрд юаней ($12 млн), не чужды международные амбиции, в частности, подразделение в США и расширение на другие языки, кроме китайского. А недавно она начала помогать шанхайской полиции расследовать преступления, изучая материалы уголовных дел, в которых могли вкрасться неточности.