Новости 8 июля 2020

Новая автоматическая модель распознавания Facebook работает с 51 языками

Далее

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На предварительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического распознавания речи (ASR). Она научилась понимать 51 язык после того, как ее обучили на 16 тыс. часов голосовых записей. В статье, опубликованной на сайте Arxiv.org, соавторы работы утверждают, что система, которая содержит около миллиарда параметров, повышает эффективность распознавания речи до 28,8%.

Прежде чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а затем выбрали 10 тыс. единиц словаря в качестве набора информации по каждой языковой группе. После этого они вручную объединили некоторые мелкие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Насколько нам известно, эта первая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру распознавания речи для 51 языка, которая не требует большого количества ресурсов», — отметили в Facebook.

Исследователи сообщают, что в ходе нескольких экспериментов наиболее эффективная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и достигает нужных результатов всего за 10 минут. Ее обучили на 53 тыс. часов «сырых» материалов.


Читайте также

Выяснилось, что заставило цивилизацию майя покинуть свои города

Ученые раскрыли план герпеса по заражению человека: он похож на игру cо ставками

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком