Baidu представила технологию расшифровки речи

Компания Baidu, известная в мире как “китайский Google”, представила SwiftScribe - веб-приложение, которое расшифровывает речь с помощью искусственного интеллекта, пишет Digital Trends.

SwiftScribe распознает файлы в формате .wav и .mp3. Как только загрузка завершена, начинается процесс расшифровки. 30-секундный файл занимает около 10 секунд, а одноминутный — менее 30. Максимальная длительность аудиозаписи, которую позволяет расшифровать приложение — 1 час, чтобы перевести ее в текст понадобится 20 минут.

Приложение не всегда работает идеально, SwiftScribe иногда пропускает слова, путается в заглавных буквах и пунктуации. Пользователям предлагается редактируемое поле, в которое можно вносить свои корректировки. Сейчас сервис работает с английским языком.

По словам проектного менеджера Baidu, Тянь Ву, SwiftScribe может сократить время на расшифровку аудио в 1,67 раза. В настоящий момент приложение доступно бесплатно, но компания надеется монетизировать его. Недавно Baidu также представила свой алгоритм Deep Voice, который научился разговаривать за несколько часов и без помощи человека.

Создатель Linux: «Разговоры об инновациях — полная чушь»

Недавно IBM объявила, что побила рекорд в технологиях распознавания речи. Компании удалось снизить долю ошибок в компьютерном распознавании речи до 5,5% — это новый рекорд. Ранее ИИ компании показывал результат в 6,9%, а прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Из перовскита создали датчик изображения, который улавливает в три раза больше света
Новости
ИИ научили предсказывать риск провала технологических новинок
Новости
Разработан нанопластырь с микроиглами, который может заменить биопсию
Наука
В глубинах Тихого океана обнаружили пауков, питающихся бактериями
Наука
Открыт белок, который восстанавливает ДНК, препятствуя старению мозга
Наука
Рассуждающая модель от китайской MiniMax потребляет меньше ресурсов, чем DeepSeek
Новости
Под Волгоградом обнаружили краску, которую использовали неандертальцы
Наука
Человеческую мочу преобразовали в материал для зубных имплантатов
Наука
Инженер-любитель спроектировал eVTOL: он может пролететь более 200 км за три часа
Новости
Из личинок мухи создали антисептик для борьбы с супербактериями
Наука
В мессенджере WhatsApp скоро появится официальная реклама
Новости
По 319 млн рублей выделят на создание центров промышленной робототехники в России
Иннополис
Инженеры создали дрон с рукой, напоминающей хобот слона
Новости
Спутники устроили искусственное затмение для изучения короны Солнца
Космос
На Кузбассе обнаружили останки флоры и фауны эпохи динозавров
Наука
Кудиты вместо кубитов: физики написали инструкцию для создания кудитных квантовых процессоров
Новости
Астрономы нашли «потерянную» половину материи во Вселенной
Космос
Микробы оказались каннибалами: голодные бактерии поедают соседей, чтобы выжить
Наука
Математики прочитают открытые лекции по оптимизации в Университете Иннополис
Иннополис
Solar Orbiter впервые сфотографировал полярную область на Солнце
Космос