Сообщить об ошибке на сайте
URL
Ошибка
Звук

Технология, разработанная учеными Принстонского университета, способна вносить изменения в аудиозапись речи так же, как текстовый редактор исправляет опечатки, добавляет слова или меняет их на синонимы. В перспективе технология позволит роботам разговаривать по-человечески и вернет естественное звучание компьютерному голосу Стивена Хокинга и других людей, лишенных возможности говорить.

Программа VoCo предлагает легкий способ добавлять или менять слова в аудиозаписях, редактируя ее транскрипцию. Новые слова автоматически синтезируются и вставляются в речь, даже если точно таких слов в записи не было.

Такая система, основанная на алгоритме глубокого обучения и воспроизведения звука, может существенно облегчить обработку видеоматериалов и подкастов. А в перспективе — стать основой для придания естественного звучания голосам роботов.

На экране компьютера пользовательский интерфейс VoCo выглядит похожим на программы редактирования аудиофайлов вроде Audacity или GarageBand. Есть окно с визуализированной кривой аудиотрека и инструменты редактирования. Однако, есть и отличия: записанные слова можно изменить, удалить или вставить новые. После этого VoCo синтезирует речь заново, переписывая файл.

Сердцевину VoCo составляет алгоритм оптимизации, умеющий находить лучшую комбинацию фонем, из которых можно составить любое слово. И для этого не обязательно искать фонемы, произнесенные голосом автора — машина может «сшить» их из обрывков звуков и вставить в речь так, что «швов» будет незаметно. Ударение и интонация также сохраняются.

Во время испытаний речь с вкраплениями искусственных фонем давали прослушать группе респондентов. В 60% случаев они принимали ее за полностью человеческую речь, сообщает EurekAlert.

«К нам обратился человек, страдающий от нейродегенеративного заболевания, который мог говорить только через систему преобразования текста в речь, которой он управлял движениями век, — рассказывает один из авторов разработки Цзэюй Цзинь. — Голос его звучал механически, как в устройстве, которое использует Стивен Хокинг. Но он хотел, чтобы его маленькая дочь могла услышать его настоящий голос. Однажды станет возможно проанализировать его прошлые записи и создать на их основе аппарат, который будет говорить его голосом».

Программу быстрой расшифровки аудиофайлов формата .wav и .mp3 представил недавно китайский поисковик Baidu. Время ее работы сокращено в 1,67 раз по сравнению с аналогами. Пока SwiftScribe работает только с английским языком и бесплатно, но в будущем ее собираются монетизировать.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Жить по-умному: как защитить свой дом и не бояться киберугроз
Умный дом
Андрей Синогейкин, Wonder Technologies, — об искусственных алмазах
Тренды
Никита Бокарев, ESforce, — о деньгах, киберспорте и его немаргинальности
Тренды
YouTube-депрессия: как создатели популярных каналов боятся потерять подписчиков и разум
Тренды
Гельмут Райзингер, Orange Business Services, — об IIoT, 5G и телеком-стартапах
Мнения
«Робот берет вас на работу»: как искусственный интеллект, блокчейн и VR подбирают персонал
Мнения
Тренды
Телемедицина, роботы и умные дома: каким через 5 лет будет «оцифрованный» город в России
Мясная революция: как перейти от веганских заменителей к клеточным технологиям и биореакторам
Идеи
AI-выборы: как искусственный интеллект и голосовые помощники сделают демократию лучше
Тренды
Идеи
Тупик для беспилотников: как мечты разработчиков разбиваются о неожиданности на дорогах
Здесь нужен InsurTech: за какими стартапами будущее страхования
Мнения
Вирус лженауки в Google: как поисковые системы распространяют опасные мифы о прививках
Идеи
«Кто-то управляет моим домом»: как жертв домашнего насилия терроризируют с помощью умных устройств
Умный дом
Паскаль Фуа, EPFL, — о ключевых точках, глубоких нейросетях и эпиполярной геометрии
Мнения
20 фильмов о кибербезопасности, взломах и цифровых преступлениях
Тренды
Ян Лекун, Facebook: «Прогностические модели мира — решающее достижение в ИИ»
Мнения
Джианкарло Суччи: «Попытка спроектировать программу без багов — утопия»
Иннополис
Game out: Как видеоигры обучают детей-аутистов держать равновесие и узнавать людей
Тренды
Прослушка, контроль камеры и предсказание смерти пользователя: самые странные патенты Facebook
Кейсы
Цес Снук, QUVA: «Мы не хотим зависеть от крупных компаний, которые владеют всеми данными»
Мнения
Иннополис
Дмитрий Песков, АСИ: «В России традиционно долго запрягают, и в сфере IT мы только этим и занимаемся»
ДНК-тесты: как генетические компании обманывают людей и разрушают семьи
Мнения
Мануэль Маццара: «Для Facebook вы не покупатель, вы — продукт»
Иннополис
Тренды
Блокчейн, искусственное мясо и «смерть» смартфонов: что будет с технологиями через 10 лет
Витторио Феррари, Google: «Чтобы машина распознала книгу о Гарри Поттере нужна сложная математическая модель»
Мнения
7 медицинских технологий, которые скоро придут в российские больницы
Идеи
Руслан Зайдуллин, основатель Doc+, — о том, что делать Минздраву и о проблемах в российской медицине
Мнения
Ричард Вдовьяк, Philips: «В будущем диагностировать заболевания будут не только врачи, но и сами пациенты»
Тренды
Шедевры за биткоины: Как криптовалюта меняет рынок искусства
Блокчейн
Почему «московий» и «оганесон» устроили раскол между физиками и химиками?
Кейсы
Тренды
Сэр Харшад Бадехиа — о бронежилетах будущего, русских математиках и металлургии
«Надежнее золота»: блокчейн в цифрах
Блокчейн
Бас Лансдорп, Mars One: «Моя жена отдала бы все, чтобы не лететь на Марс»
Полет на Марс
Как big data, блокчейн и 3D-печать сделали пищу полезнее
Мнения
Томас Циммерман, IBM, — о том, как остановить конец света, спасая планктон
Тренды
Без Siri, Алисы и «Окей, Google»: как и зачем нас подслушивают собственные телефоны
Тренды
Шрада Агарвал, Outcome Health: «Когда человек знает о своей болезни, от этого выигрывает и он, и фарма»
Мнения
Тренды
«Дорогая, я ухожу от тебя к роботу!»: заменят ли секс-андроиды реальные отношения?
7 правил для начинающих и разумных блокчейн-инвесторов
ICO
Четвертая революция: как интернет вещей изменит промышленность и нефтедобычу
Тренды
Не витайте в «облаках»: как провайдеры обманывают доверчивых клиентов
Мнения
Когда мы начнем летать на автомобилях в городе?
Тренды
Кейсы
Как в Россию проникают технологии: интернет-рестораны, маникюр на дому и «умное» страхование
Гендиректор Uber Дара Хосровшахи: «Автомобили должны ездить в трех измерениях»
Мнения
Олег Бабкин: «Системных администраторов никто не обучает, обучают только разработчиков»
Мнения
«Чтобы создать новое лекарство, нужно 10–12 лет и миллиард долларов»
Мнения
Сооснователь «Евросети» Тимур Артемьев: «Мы будем летать из Лондона в Сидней через космос. Так ближе»
Тренды
Новый стандарт рекламного рынка: что нужно знать о programmatic, чтобы рекламироваться эффективно
Тренды
Иван Горшунов, Etcetera, — о мобильных приложениях, стартапах и «внутренней девятиэтажке», которая мешает заглянуть за горизонт
Мнения