Очки с ИИ научили «читать по губам» без использования камеры

Инженеры создали систему распознавания речи на основе мимических движений, которая работает как минисонар (эхолокатор). Разработка будет представлена на международной конференции CHI в Германии.

Исследователи из Корнельского университета разработали интерфейс EchoSpeech для распознавания тихой речи, который использует акустическое восприятие и искусственный интеллект для непрерывного распознавания до 31 невокализованной команды на основе движений губ и рта. Обработка информации осуществляется локально на смартфоне, что обеспечивает конфиденциальность данных.

Очки EchoSpeech оснащены парой микрофонов и динамиков, размер которых меньше ластика на конце карандаша, и не используют камеру. Устройство отправляет и улавливает акустические волны, которые показывают изменения динамики лицевых мышц и рта. Алгоритм глубокого обучения анализирует эти эхо-профили в режиме реального времени с точностью около 95%. 

Принцип работы EchoSpeech. Изображение: Ruidong Zhang et al.

Полученные данные передаются через Bluetooth в режиме реального времени на смартфон, обрабатываются и хранятся локально на устройстве. Разработчики сообщают, что EchoSpeech достаточно нескольких минут для обучения для конкретного пользователя.

Для людей, которые не могут говорить, эта технология безмолвной речи может стать отличным голосовым синтезатором. Она может вернуть пациентам их голос.

Жуйдун Чжан, соавтор разработки

Большинство технологий распознавания немой речи ограничены избранным набором предопределенных команд и требуют, чтобы пользователь и его собеседник смотрели в камеру или носили ее. Это существенно затрудняет возможности применения таких устройств. Кроме того, большой поток данных требует обработки в облаке, что нарушает конфиденциальность пользователей.

В своем нынешнем виде EchoSpeech можно использовать для общения с другими через смартфон в местах, где речь неудобна или неуместна, например, в шумном ресторане или тихой библиотеке. Бесшумный речевой интерфейс также можно использовать в паре со стилусом и программным обеспечением для проектирования, таким как САПР, практически исключая необходимость в клавиатуре и мыши, добавляют разработчики.


Читать далее:

Ученые выяснили природу странных радиосигналов с планеты, похожей на Землю

Красный ореол вспыхнул над Италией. Теперь его природу объяснили

«Уэбб» нашел самую старую черную дыру во Вселенной

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найдены останки римского легионера, которого сурово наказали за предательство
Наука
Новая смелая гипотеза переписывает историю Вселенной
Космос
Эйнштейн был прав: его открытие поможет раскрыть тайну нейтронных звезд
Космос
Гель для защиты от радиации разработали в Европе
Космос
Шаг к созданию мантии-невидимки: ученые добились отрицательного преломления света 
Наука
Telegram выкатил крупное обновление по работе с видео
Новости
Вошел как влитой: в России создали легко интегрируемый аналог Microsoft AD
Технологии
Китайский робопес впервые участвовал в пожарно-спасательной операции
Новости
Таинственные космические огни оказались странными остатками взорвавшихся звезд
Космос
Британский стартап показал робота, который манипулирует руками быстрее человека
Новости
Четвертому пациенту пересадили модифицированную почку свиньи
Наука
Посмотрите на цветные облака, которые плывут в небе над марсоходом «Кьюриосити»
Космос
Инженеры MIT напечатали дешевый двигатель для маленьких спутников
Новости
Началась разработка космического двигателя на воде: что о нем известно
Космос
Через Млечный Путь несется пара объектов на гиперскорости: что о них известно
Космос
Названы опасные побочные эффекты использования ИИ для мозга
Наука
НАСА рискуют провалить главную лунную программу и не только
Кейсы
Прибор для анализа крови без уколов привлек 35 млн рублей от стартап-студии
Наука
«Джеймс Уэбб» рассмотрит астероид, который может угрожать Земле
Космос
Телескоп «Евклид» наблюдал редкое кольцо Эйнштейна в соседней галактике
Космос