Baidu представила технологию расшифровки речи

Компания Baidu, известная в мире как “китайский Google”, представила SwiftScribe - веб-приложение, которое расшифровывает речь с помощью искусственного интеллекта, пишет Digital Trends.

SwiftScribe распознает файлы в формате .wav и .mp3. Как только загрузка завершена, начинается процесс расшифровки. 30-секундный файл занимает около 10 секунд, а одноминутный — менее 30. Максимальная длительность аудиозаписи, которую позволяет расшифровать приложение — 1 час, чтобы перевести ее в текст понадобится 20 минут.

Приложение не всегда работает идеально, SwiftScribe иногда пропускает слова, путается в заглавных буквах и пунктуации. Пользователям предлагается редактируемое поле, в которое можно вносить свои корректировки. Сейчас сервис работает с английским языком.

По словам проектного менеджера Baidu, Тянь Ву, SwiftScribe может сократить время на расшифровку аудио в 1,67 раза. В настоящий момент приложение доступно бесплатно, но компания надеется монетизировать его. Недавно Baidu также представила свой алгоритм Deep Voice, который научился разговаривать за несколько часов и без помощи человека.

Создатель Linux: «Разговоры об инновациях — полная чушь»

Недавно IBM объявила, что побила рекорд в технологиях распознавания речи. Компании удалось снизить долю ошибок в компьютерном распознавании речи до 5,5% — это новый рекорд. Ранее ИИ компании показывал результат в 6,9%, а прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
В мозге нашли нервные клетки, которые регулируют набор веса
Наука
Электросамолеты смогут летать дальше: MIT представил мощные топливные элементы
Наука
Anthropic открыла доступ к поиску для пользователей чат-бота с ИИ Claude
Новости
Противораковые препараты на треть увеличили срок жизни мышей
Наука
В Китае придумали, как решить проблему опасных вибраций в маглеве
Новости
Роботизированные комплексы для обучения студентов внедрят в российские вузы
Иннополис
Дуров договорился с xAI Маска продвигать ИИ Grok в Telegram
Новости
Камни для крокодилов и контроль качества альтушек: четвертый «ТехПредКлуб» прошел в Томске
Новости
Acer случайно раскрыла характеристики RTX 5050 еще до анонса от Nvidia
Новости
Представлено полностью российское ПО для управления программно-определяемыми сетями
Новости
Назван самый популярный смартфон в России за три года
Новости
Военные США энерголучом поджарили объект на рекордной дальности
Наука
Посмотрите, как вулкан выбросил лаву на высоту 300 метров: чем это опасно
Наука
Почему кошки приносят домой грызунов на самом деле
Наука
ИИ создал фальшивое уличное интервью, которое обмануло интернет
Новости
Чем питался мегалодон на самом деле: учёные пересмотрели рацион гигантской акулы
Наука
Серьезная угроза для Земли скрывается рядом с Венерой: ученые требуют срочной разведки
Космос
Мошенники в Telegram используют новую схему — предлагают «работу» за лайки и крадут деньги
Новости
Патологоанатом рассказал о самых странных и абсурдных причинах смерти
Наука
Эта нейросеть подскажет, почему жена злится и кричит на мужа
Новости