Сообщить об ошибке на сайте
URL
Ошибка
Распознавание речи

Исследователи ИИ-подразделения Microsoft объявили, что созданная ими система распознавания речи практически сравнялась с человеком. Вероятность ошибки в кодовом слове (WER) составила 5,9% — столько же, сколько у профессиональных транскрибаторов.

Добиться таких показателей ученым помогли глубокие нейронные сети, способные хранить значительные объемы информации, — так называемые наборы обучающих данных. С их помощью система научилась распознавать паттерны в речи человека. Исследователи применили нейронные языковые модели для формирования ассоциативных облаков слов.

Система научилась понимать, что слово fast по смыслу ближе к quick, но никак не к slow. Благодаря этому алгоритм лучше ориентируется в речи и лучше понимает контекст. В процессе разработки был использован набор инструментов глубокого обучения Computational Network Toolkit от Microsoft.

Напомним, в сентябре разработчики Microsoft достигли самого высокого в мире уровня распознавания речи на тот период — процент ошибок алгоритма составил всего 6,3%. На этот раз компания побила собственный рекорд на 0,4%. Такой процент ошибок считается самым низким в индустрии. Показатель WER у профессиональных транскрибаторов так же составляет 5,9%, отмечает Microsoft в тексте исследования.

Главный эксперт компании по изучению речи Сюэдун Хуанг заявил, что равенство ИИ и человека в этой сфере следует считать историческим достижением. Однако авторы исследования подчеркивают, что алгоритм, как и человек, пока далек от совершенства. Исследователи будут испытывать систему в шумной среде — на улицах, в ресторанах и на открытых площадках в ветреную погоду. Следующим поворотным моментом должно стать не только распознавание речи, но и ее понимание, считают в компании.

Установленный рекорд позволит усовершенствовать системы распознавания речи в Xbox, Cortana и других продуктах Microsoft.

Алгоритмы учатся не только понимать речь, но и синтезировать ее. Так нейросеть WaveNet от DeepMind говорит по-английски и по-китайски более естественно, чем новейшие системы TTS Google. Хотя пока что спутать робота с человеком нельзя, система все равно превосходит большинство существующих аналогов.

Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 2 раза в день

перейдите по одной из ссылок и нажмите кнопку Join
К концу года мощность солнечной энергетики Китая достигнет 50 ГВт
Тренды
Тим Кук лично ответил поклоннику Mac mini о будущем модели
ИТ-компании
Тренды
Amazon станет первой в мире компанией, которая стоит $1 трлн
Молекулы-самоубийцы могут защитить нас от рака
Борьба с раком
Blue Origin впервые провела огневые испытания своего двигателя BE-4
Частный космос
Уникальная бетонная крыша превращает жилой дом в электростанцию
Солнечная энергетика
Toyota Sora — новый водородный автобус для гостей Олимпийских игр
Транспорт будущего
Ученые создали двумерный «идеальный» транзистор
Новая электроника
Huawei добилась 20 Гбит/с в испытаниях 5G Dual Connectivity
Переход на 5G
Сингапурские ученые делают фотоэлементы из меди, цинка и олова
Энергия солнца
В Швеции выбрали место для строительства конкурента Gigafactory
Тренды
Транспорт будущего
Маск купил еще одну буровую машину и роет тоннель в Вашингтон
Россия получила рекордное количество медалей на World Skills 2017
Кейсы
Эндрю Ын возглавил стартап, разрабатывающий чатбота-психотерапевта
Кейсы
Блокчейн может трансформировать сферу туризма
Блокчейн-технологии
Водоросли помогли улучшить органические солнечные элементы
Солнечная энергия
Veo Robotics переложит тяжелый труд на плечи роботов
Робототехника
Блокчейн и криптовалюты совершат революцию в БОД
Соцпособия будущего
Flare — камера слежения с ИИ для умного дома
Умный дом
Разработана компьютерная память молекулярного уровня
Компьютерная память
Астрофизика
5 открытий в сфере гравитационных волн, которые изменили астрофизику
4 фактора, которые преобразят IoT
Интернет вещей
Синтезирован препарат, эффективно подавляющий ВИЧ
Лечение ВИЧ
«Вертолеты России» покажут электрический конвертоплан в 2019 году
Городская авиация
Число криптовалютных хедж-фондов перевалило за сотню
Тренды
Идеи
Toyota создала водородный минивэн с дальностью хода 1000 км
В США стартует первый государственный эксперимент с выплатой БОД
Тренды
В Китае открыли роботизированную промзону за $300 млн
Промышленная робототехника
В Канаде начали тестировать робомобили на дорогах общего пользования
Беспилотные автомобили
В Шотландии запущена первая плавучая ветровая ферма
Ветровая энергетика
Робот-садовник поливает и защищает растения от вредителей
Робототехника
Электромопед от Honda станет домашней системой хранения энергии
Электромотоциклы
Криптовалюты
Виталик Бутерин: «Центробанкам еще далеко до введения криптовалют»
Eviation обещает запустить авиационный Uber в 2019 году
Электроавиация
Роберт Уразов: «На смену дипломам приходят паспорта навыков»
Тренды
Биосфера
Ученые не могут объяснить резкое сокращение числа летающих насекомых
Китай выпустит 1 млн электромобилей в 2018 году
Электромобили
ИИ от DeepMind стал гроссмейстером по игре го за 3 дня
Искусственный интеллект
Центробанк Бразилии признал биткойн финансовой пирамидой
Криптовалюты
«Мозги» беспилотной системы Apple размещаются на крыше автомобиля
Беспилотный транспорт
Новое открытие приближает появление квантовых компьютеров
Нанотехнологии
В 2018 году Baidu запустит в Китае беспилотный автобус
Беспилотный транспорт
Garmin Speak — умный автонавигатор с Alexa
Умный автомобиль
Daimler показала, на что способны ее беспилотные грузовики
Беспилотный транспорт
Рейтинг лучших
11 главных инженерных инноваций 2017 года
Электробайки Zero станут в 2018 году быстрее, мощнее, выносливее
Транспорт будущего
Samsung хочет подключить всю бытовую технику к IoT
Интернет вещей
Полиция Лос-Анджелеса начнет использовать дронов
Тренды
«Нельзя управлять экономикой, имея только бакалавров и магистров»
Кейсы