Новая автоматическая модель распознавания Facebook работает с 51 языками

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На предварительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического распознавания речи (ASR). Она научилась понимать 51 язык после того, как ее обучили на 16 тыс. часов голосовых записей. В статье, опубликованной на сайте Arxiv.org, соавторы работы утверждают, что система, которая содержит около миллиарда параметров, повышает эффективность распознавания речи до 28,8%.

Прежде чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а затем выбрали 10 тыс. единиц словаря в качестве набора информации по каждой языковой группе. После этого они вручную объединили некоторые мелкие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Насколько нам известно, эта первая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру распознавания речи для 51 языка, которая не требует большого количества ресурсов», — отметили в Facebook.

Исследователи сообщают, что в ходе нескольких экспериментов наиболее эффективная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и достигает нужных результатов всего за 10 минут. Ее обучили на 53 тыс. часов «сырых» материалов.


Читайте также

Выяснилось, что заставило цивилизацию майя покинуть свои города

Ученые раскрыли план герпеса по заражению человека: он похож на игру cо ставками

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
ИИ нашел асимметрию материи и антиматерии на Большом адронном коллайдере
Наука
TikTok вернулся в Россию? Что известно прямо сейчас
Новости
В Японии разработали устройство 6G, которое передает данные со скоростью 100 Гбит/с
Новости
Климатологи объяснили формирование в Антарктиде полыньи размером с Чехию
Наука
Частые кризисы повысили способность человечества выживать
Наука
Физики наблюдали кота Шредингера — превращение атомов из частиц в волну
Наука
Найдена самая глубокая дыра в мире
Наука
«Вышка» заряжает карьеру в IT
Технологии
Ученые создали клей, который работает как паутина Человека-паука (почти)
Наука
Новый препарат может обратить диабет вспять
Наука
На Марсе участились полярные сияния: что это значит
Космос
Форма известной туманности оказалась совсем не такой, как считали ученые
Наука
Исламский «Экскалибур» нашли в Испании: ему больше 1000 лет
Наука
«Человеческие нейронные сети потребляют около 20 Вт, а искусственные — сотни ватт»
Технологии
Ученые преодолели одно из ключевых препятствий для термоядерной энергетики
Наука
Телескоп «Джеймс Уэбб» показал детали космической Конской Головы
Космос
Ученые выяснили, как парниковые газы влияют на распространение болезней
COVID-19
Найдены доказательства необычной силы магнитного поля Земли в прошлом
Наука
Посмотрите, как быстро робот-гуманоид управляется с домашними задачами
Новости
Ядро атома впервые возбудили лазером: это открывает сверхточные измерения времени
Наука