Новая автоматическая модель распознавания Facebook работает с 51 языками

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На предварительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического распознавания речи (ASR). Она научилась понимать 51 язык после того, как ее обучили на 16 тыс. часов голосовых записей. В статье, опубликованной на сайте Arxiv.org, соавторы работы утверждают, что система, которая содержит около миллиарда параметров, повышает эффективность распознавания речи до 28,8%.

Прежде чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а затем выбрали 10 тыс. единиц словаря в качестве набора информации по каждой языковой группе. После этого они вручную объединили некоторые мелкие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Насколько нам известно, эта первая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру распознавания речи для 51 языка, которая не требует большого количества ресурсов», — отметили в Facebook.

Исследователи сообщают, что в ходе нескольких экспериментов наиболее эффективная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и достигает нужных результатов всего за 10 минут. Ее обучили на 53 тыс. часов «сырых» материалов.


Читайте также

Выяснилось, что заставило цивилизацию майя покинуть свои города

Ученые раскрыли план герпеса по заражению человека: он похож на игру cо ставками

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
ИИ использует единый центр обработки разных типов данных, как мозг человека
Новости
Японский лунный модуль подлетел к Луне и сфотографировал спутник вблизи
Космос
Дикие рыбы способны запоминать и узнавать дайверов, показал эксперимент
Наука
НАСА на 40% повысило риск падения на Землю астероида, способного уничтожить город
Космос
Биоинженеры создали из мидий и слизи антибактериальный клей
Наука
Телескоп с «глазом лобстера» обнаружил редкую двойную звездную систему
Космос
Solar Orbiter приблизится к Венере, чтобы подняться к полюсу Солнца
Космос
В Китае объединили солнечную энергетику с выращиванием морских огурцов
Новости
Какие навыки нужны системному аналитику
Технологии
Появление речи связали с эволюцией одного белка
Наука
Для запрещенной соцсети проложат крупнейший в мире подводный кабель
Новости
Илон Маск представил Grok 3 — ИИ нового поколения с мощным дата-центром
Новости
Эксперты проверили «чудо» со статуей Девы Марии: что показал ДНК-тест
Наука
Время может двигаться вперед и назад одновременно: что выяснили физики
Наука
Космологический принцип Вселенной поставили под сомнение
Космос
Ядерные часы могут появиться в России уже в 2030 году  
Наука
Эмоции животных теперь можно определить с помощью ИИ
Новости
Создан переключатель генов для клеточной терапии на основе пластыря
Наука
Ученые предположили, что разумная жизнь на Земле — закономерность, а не случайность
Наука
Ледяные шапки на Земле — редкая аномалия, заявляют учение
Наука