Сообщить об ошибке на сайте
URL
Ошибка
Звук

Технология, разработанная учеными Принстонского университета, способна вносить изменения в аудиозапись речи так же, как текстовый редактор исправляет опечатки, добавляет слова или меняет их на синонимы. В перспективе технология позволит роботам разговаривать по-человечески и вернет естественное звучание компьютерному голосу Стивена Хокинга и других людей, лишенных возможности говорить.

Программа VoCo предлагает легкий способ добавлять или менять слова в аудиозаписях, редактируя ее транскрипцию. Новые слова автоматически синтезируются и вставляются в речь, даже если точно таких слов в записи не было.

Такая система, основанная на алгоритме глубокого обучения и воспроизведения звука, может существенно облегчить обработку видеоматериалов и подкастов. А в перспективе — стать основой для придания естественного звучания голосам роботов.

На экране компьютера пользовательский интерфейс VoCo выглядит похожим на программы редактирования аудиофайлов вроде Audacity или GarageBand. Есть окно с визуализированной кривой аудиотрека и инструменты редактирования. Однако, есть и отличия: записанные слова можно изменить, удалить или вставить новые. После этого VoCo синтезирует речь заново, переписывая файл.

Сердцевину VoCo составляет алгоритм оптимизации, умеющий находить лучшую комбинацию фонем, из которых можно составить любое слово. И для этого не обязательно искать фонемы, произнесенные голосом автора — машина может «сшить» их из обрывков звуков и вставить в речь так, что «швов» будет незаметно. Ударение и интонация также сохраняются.

Во время испытаний речь с вкраплениями искусственных фонем давали прослушать группе респондентов. В 60% случаев они принимали ее за полностью человеческую речь, сообщает EurekAlert.

«К нам обратился человек, страдающий от нейродегенеративного заболевания, который мог говорить только через систему преобразования текста в речь, которой он управлял движениями век, — рассказывает один из авторов разработки Цзэюй Цзинь. — Голос его звучал механически, как в устройстве, которое использует Стивен Хокинг. Но он хотел, чтобы его маленькая дочь могла услышать его настоящий голос. Однажды станет возможно проанализировать его прошлые записи и создать на их основе аппарат, который будет говорить его голосом».

Программу быстрой расшифровки аудиофайлов формата .wav и .mp3 представил недавно китайский поисковик Baidu. Время ее работы сокращено в 1,67 раз по сравнению с аналогами. Пока SwiftScribe работает только с английским языком и бесплатно, но в будущем ее собираются монетизировать.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

SONM: как люди будут зарабатывать на собственных компьютерах с помощью блокчейна
Кейсы
Егор Матешук, ostrovok.ru: проблемы big data можно решить, закидывая пачки денег в топку
Мнения
Художник-граффитист Миша Most: технология — это кисть, которая создает будущее
Мнения
Лунная гонка: как мировые державы собираются присвоить себе спутник Земли
Идеи
Тренды
Итоги Нобелевской недели. За что дали Нобелевскую премию в 2018 году?
Руслан Шагалеев, Иннополис: война между корпорациями и городами ведется за человеческий капитал
Идеи
Кристина Хаверкамп, DENA: цена на электроэнергию должна сильнее коррелировать c погодой: много солнца и ветра — дешево, мало — дорого
Тренды
Тренды
7 лучших книг о технологиях и науке на русском языке, вышедших в 2018 году
Микрореволюция: фермеры с помощью микробов спасут мир от голода
Идеи
Александр Тормасов, Университет Иннополис: мозги людей могут быть совершенно не готовы к восприятию новых идей
Мнения
Одежда, которая поможет миру: костюм-помощник, майка-тренер и носок-няня
Тренды
В ожидании первого удара: как США готовятся к атаке со стороны России и Китая
Тренды
Страшнее метана: какие еще промышленные выбросы разрушают озоновый слой
Тренды
Интеллект большого города: как данные и умные алгоритмы улучшают качество жизни в мегаполисах
Тренды
На защите европейцев: как GDPR стал дырой в бюджете российских ИТ-компаний
Мнения
Игорь Балк, Global Innovation Labs: в XXI веке приватности нет и не будет
Тренды
Deneum: как заниматься холодным ядерным синтезом и бороться с сомнениями ученых
Кейсы
Расист, оружие и предвзятый судья — каким станет искусственный интеллект в будущем
Тренды
На совести информаторов: как громкие скандалы вокруг АНБ, Facebook и Tesla изменили мир
Тренды
NativeOS: нативная реклама в видео без репутационных потерь и терроризма от режиссера короткометражек
Кейсы
Тренды
Тихий убийца: как микропластик вызывает болезни и останавливает репродукцию живых организмов
Гонка для JavaScript-разработчиков: как постоянные обновления мешают работе
Тренды
Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные
Тренды
Николь Миллс, Booking.com — об инновациях, agile-подходе и индустрии впечатлений
Кейсы
Слишком опасный нанопластик: как одноразовые пакеты превращаются в частицы-убийцы
Тренды
Идеи
Человек и квантовая теория: существует ли то, что мы не наблюдаем
Здесь может быть ваша реклама: НАСА планирует заработать на космосе миллионы
Тренды
Опасный криптотрейдинг: как киберпреступники угрожают виртуальным сбережениям и биржам
Тренды
Тренды
Как через 20 лет будет выглядеть армия будущего
5 финансовых инструментов, которые помогут инвесторам даже после падения криптовалюты
Тренды
Александр Лямин, Qrator Labs: наша задача — выработать у людей цифровую гигиену, чтобы они «не ели с помойки»
Кейсы
Эдуард Фош Вильяронга: люди видят в роботе только внешность, забывая, что он следит за ними
Тренды
Доктор Куэй Во-Райнард, HIT Foundation: если страна требует суверенитета данных, мы построим для нее отдельный блокчейн
Кейсы
«Хакинтош»: как собрать свой собственный Mac лучше, чем у Apple
Идеи
Роботы против мигрантов: какой вклад в ксенофобию и расизм делают технологии ИИ
Тренды
Война скриптов — искусственный интеллект против навязчивой рекламы
Тренды
Как заново изобрести супермаркет: осознанность потребления, этика производства и роботы
Тренды
Каждый человек станет сам себе банком: цифровой мир отказывается от посредников между бизнесом и клиентом
Тренды
Архитектор вычислительной инфраструктуры «Платона» Александр Варламов — о будущем ИТ-индустрии в России, стартапах и разработке
Кейсы
Дмитрий Богданов, капитан сборной России по CS:GO — о стиле жизни киберспортсмена, тренировках и блокировках РКН
Тренды
Идеи
Космос — наш дом: что осталось решить ученым, чтобы поселить человека за пределами Земли
Прайсинг, трекинг, скоринг, биллинг и другие технологии, которые двигают российский бизнес
Тренды
Кейсы
«Педиатр 24/7»: как телемед-стартап подарил родителям спокойствие, а врачам — работу
Вас снова обманули: как человечество учит компьютеры определять фейки в интернете
Тренды
БиСи Бирман, Heavy Projects: ИИ должен иметь несовершенства — это элемент случая
Мнения
Артем Геллер, lab.ag: делая сервис для государства, ты помогаешь своей бабушке
Мнения
Акселераторы и инкубаторы: что выбрать стартапу на раннем этапе развития
Мнения
Вопрос доверия: как и почему изменилось отношение к телемедицине в России
Тренды
Правительственные криптопесочницы: как освободить финтех от давления закона и защитить потребителей
Тренды