Компания предоставляет возможность воспользоваться своим сервисом Custom Recognition Intelligence Service (CRIS), наделяющим приложения функцией «голос в текст».
Заодно Microsoft открывает публичный показ двух комплектов интерфейсов прикладного программирования (API) с технологией распознавания речи в аудио- и видеозаписи.
Все эти действия являются частью инициативы Project Oxford, которая дает сторонним разработчикам доступ к искусственному интеллекту, который годами разрабатывала Microsoft. Кстати, Google предпринимает аналогичные шаги со своим Cloud Vision API.
В прошлом месяце компания анонсировала в рамках проекта инструмент распознавания эмоций. Сейчас — платформу для идентификации персоны по голосу или лицу.
Но более интересной представляется инструмент CRIS, который «облегчает распознавание речи в сложных условиях, например, в шумных общественных местах. (…) Его можно также использовать для помощи в распознавании речи тем,у кого с этим возникают сложности, например, у иностранцев или людей с нарушениями слуха».
За последние годы системы распознавания речи совершили громадный шаг вперед, и Microsoft побуждает сторонних разработчиков поддержать и ускорить этот процесс.