Социальная сеть «ВКонтакте» создала свою технологию для распознавания речи. На ее основе в видео появятся субтитры.
В пресс-службе социальной сети рассказали, что новая технология распознает слова в видео, добавляет знаки препинания и заглавные буквы. Разработчики отмечают, что аналогичные технологии не умеют распределять запятые и точки, а также не понимают, где начинается и заканчивается предложение.
Кроме этого, новую технологию позже научат разделять речь разных героев по репликам.
Сейчас субтитры доступны только в экспериментальном режиме для части аудитории. Они есть пока только в популярных видео из верифицированных сообществ в веб-версии и мобильном приложении «ВКонтакте».
До конца года автоматические субтитры станут доступны для большинства видео.
Все решения, использующиеся для автогенерации субтитров, — собственные разработки. Это позволяет адаптировать их под разные функции сервиса и настраивать для максимально эффективной работы. Например, для создания субтитров мы усовершенствовали наши ASR-технологии и реализовали решения, которые точно синхронизируют текст с речью на видео. В будущем мы продолжим развивать нейросетевые технологии и внедрять машинное обучение в разные сервисы «ВКонтакте».
Александр Тоболь, технический директор «ВКонтакте»
В пресс-службе отметили, что новая технология будет полезна, когда нужно посмотреть видео без звука или не хочется мешать окружающим. Кроме этого, она поможет людям с нарушениями слуха легче воспринимать информацию.
Читать далее
Китайский электромобиль с открытым верхом маневрирует как мотоцикл и меняет положение руля
Посмотрите на цифровое искусство, которое сделали на основе анализа книг Айзека Азимова