Baidu представила голосовую виртуальную клавиатуру для Android

Приложение TalkType для мобильных устройств на базе Android выводит на передний план голосовой набор, а не традиционный метод ввода текста. В основе разработки лежит алгоритм машинного обучения, который превосходит человека по скорости и качеству набора текста. Технология Baidu позволяет свободно диктовать текст любого объема и сложности на английском языке, впрочем без "трудностей перевода" не обошлось

TalkType распознает английскую речь, а также отдельные голосовые команды, в том числе знаки препинания. Приложение разработало подразделение Baidu Research, которое базируется в калифорнийской Кремниевой долине и в Пекине. «TalkType — это первая смартфон-клавиатура, в которой голос играет ключевую, а не вспомогательную роль», — отметил руководитель лаборатории ИИ Baidu Research Биджит Халдер.

В основе TalkType лежит алгоритм распознавания речи Deep Speech 2, адаптированный для английского и китайского языков. Еще летом эту технологию испытали эксперты из Стэнфордского университета и Университета штата Вашингтон. Алгоритм соревновался с 32 участниками эксперимента. Они должны были набирать словосочетания на слух. Англоязычные пользователи использовали раскладку QWERTY, а носители китайского языка — клавиатуру пиньинь для iOS. В результате Deep Speech 2 набирала тексты на английском языке в 3 раза быстрее, а на китайском в 2,8 раз быстрее человека, а также делала меньше ошибок — особенно на китайском языке.

Робот-каменщик теперь может выкладывать 1000 кирпичей в час

В программе также есть функция QuickShare, которая позволяет быстро вставлять GIF-изображения, геолокацию и другие данные. Приложение уже доступно бесплатно на Google Play, но пока что только с поддержкой английского языка.

Впрочем, в реальных условиях результат машинного набора текста пока далек от идеала. Издание Quartz опубликовало новостную заметку о голосовой клавиатуре, используя ее для набора текста. Корреспондент Дэвид Гершгорн приводит две версии каждого абзаца — расшифровку TalkType и отредактированную человеком версию. Как отмечает журналист, с именами собственными программа справляется плохо, а необходимость называть знаки препинания вслух утомляет.

Ученые приблизили создание компьютеров нового поколения

Тем не менее, многие эксперты прогнозируют постепенный переход от привычных методов ввода к голосовым интерфейсам. Виртуальные помощники, вроде Siri и Alexa, все лучше распознают речь и команды. Google недавно приобрела российский стартап Api.ai — платформу для разработки клиентоориентированных голосовых интерфейсов. В Google считают, что за ними будущее. Ранее глава компании Сундар Пичаи заявил, что пользователи направляют 20% поисковых запросов в Google на мобильных телефонах с помощью голоса. Сегодня голосовые интерфейсы позволяют управлять транспортными средствами, приборами интернета вещей и даже удостоверять свою личность в банке.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Роботов научили определять местоположение людей на слух
Новости
Физики установили новый мировой рекорд точности работы кубита
Наука
Ученые восстановили пути миграции неандертальцев из Европы в Сибирь
Наука
В Китае создали ИИ для проектирования чипов: он справился за несколько дней
Новости
Четыре спутника НАСА наблюдали гигантский выброс плазмы на Солнце
Космос
Математики МГУ описали движение веществ в организме человека
Наука
В Стэнфорде создали вращающееся устройство, которое удаляет тромбы
Наука
В космосе впервые обнаружили гигантскую молекулу с 24 атомами углерода
Космос
Из-за отказа от прививок в России растет заболеваемость корью и коклюшем
Наука
Инженеры создали мягкого робота, который управляется лазерными лучами
Новости
В Apple усомнились в способности существующих моделей ИИ рассуждать
Новости
В IBM назвали сроки создания первого масштабного квантового компьютера
Новости
Посмотрите с орбиты Марса на гигантский вулкан, возвышающийся над облаками
Космос
В России приняли закон о создании единого национального мессенджера
Новости
Ученые выяснили, почему у летучих мышей «долгожителей» не бывает рака
Наука
Открыт прием заявок на премию «Промышленная робототехника»
Иннополис
Геофизик записал альбом из «музыки» сейсмических волн месторождения нефти
Новости
В желудке зауропода нашли остатки пищи: травоядный гигант глотал растения целиком
Наука
Tecno Camon 40: фокус на AI
Технологии
Apple показала обновления в iOS 26 функций ИИ, но отложила выпуск улучшенной Siri
Новости