Технологии

Microsoft отдает Кортану в руки сторонних разработчиков

Далее

Компания предоставляет возможность воспользоваться своим сервисом Custom Recognition Intelligence Service (CRIS), наделяющим приложения функцией «голос в текст».  

Заодно Microsoft открывает публичный показ двух комплектов интерфейсов прикладного программирования (API) с технологией распознавания речи в аудио- и видеозаписи.

Все эти действия являются частью инициативы Project Oxford, которая дает сторонним разработчикам доступ к искусственному интеллекту, который годами разрабатывала Microsoft. Кстати, Google предпринимает аналогичные шаги со своим Cloud Vision API.

В прошлом месяце компания анонсировала в рамках проекта инструмент распознавания эмоций. Сейчас — платформу для идентификации персоны по голосу или лицу.

Но более интересной представляется инструмент CRIS, который «облегчает распознавание речи в сложных условиях, например, в шумных общественных местах. (…) Его можно также использовать для помощи в распознавании речи тем,у кого с этим возникают сложности, например, у иностранцев или людей с нарушениями слуха».

За последние годы системы распознавания речи совершили громадный шаг вперед, и Microsoft побуждает сторонних разработчиков поддержать и ускорить этот процесс.

Загрузка...