Кейсы 20 сентября 2016

Microsoft установила рекорд в технологиях распознавания речи

Далее

Разработчики Microsoft достигли самого высокого в мире уровня распознавания речи. По данным статьи, опубликованной компанией, процент ошибок всего 6,3%. У человека он – 4%.

По словам главного исследователя по распознаванию речи в Microsoft Сюэдуна Ханга, процент ошибок их алгоритма является самым низким в индустрии. В это же время IBM сообщила об улучшении показателей работы своего алгоритма, но результат оказался на 0,3% хуже, чем у Microsoft.

Каждая доля процента, покоренная разработчиками, все сильнее приближает машины к человеческому уровню восприятия. Если верить IBM, то при попытках распознавания речи человек ошибается в 4% случаев. Еще 20 лет назад машины ошибались более чем в 43% случаев. Сегодня же вполне вероятно, что алгоритмы обгонят человека по этому показателю.

«Успех этого алгоритма — результат большого количества успешных исследований и разработок ИИ-сообщества за последние 20 лет», — говорит Сюэдун Ханг. Среди них вдохновленные биологией нейросети, алгоритмы глубокого обучения и адаптация GPU для ведения вычислений.

Microsoft надеется, что это достижение позволит улучшить работу персонального ИИ-ассистента Cortana и других разработок типа Skype Translator. Человек не должен страдать от непонимания со стороны машин, они должны его услышать.

Чего ждать от детей, растущих в окружении мыслящих машин

Услышав же человека, машине также необходимо понять, с кем именно она общается. Развитие нейронных сетей и глубокого обучения тянет на верх и точность распознавания лиц — ошибок там чуть больше 4%, но это определенно ненадолго. Машины постепенно учатся понимать окружающий мир эффективнее.