Новая автоматическая модель распознавания Facebook работает с 51 языками

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На предварительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического распознавания речи (ASR). Она научилась понимать 51 язык после того, как ее обучили на 16 тыс. часов голосовых записей. В статье, опубликованной на сайте Arxiv.org, соавторы работы утверждают, что система, которая содержит около миллиарда параметров, повышает эффективность распознавания речи до 28,8%.

Прежде чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а затем выбрали 10 тыс. единиц словаря в качестве набора информации по каждой языковой группе. После этого они вручную объединили некоторые мелкие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Насколько нам известно, эта первая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру распознавания речи для 51 языка, которая не требует большого количества ресурсов», — отметили в Facebook.

Исследователи сообщают, что в ходе нескольких экспериментов наиболее эффективная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и достигает нужных результатов всего за 10 минут. Ее обучили на 53 тыс. часов «сырых» материалов.


Читайте также

Выяснилось, что заставило цивилизацию майя покинуть свои города

Ученые раскрыли план герпеса по заражению человека: он похож на игру cо ставками

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Уборка перестает быть мучением: обзор моющего пылесоса Trouver X4 Pro
Кейсы
Посмотрите на парового робота, который ползает и цепляется за ветки
Новости
На Юпитере «моросит дождь» из частиц: «Уэбб» раскрыл детали полярных сияний газового гиганта
Космос
В Сколтехе создали «фонарик» для исследования сосудов изнутри
Наука
Большой взрыв мог быть менее «ярким»: другие источники света нашли на заре Вселенной
Космос
В доме в Помпеях нашли следы попытки жителей спастись от катастрофы
Наука
Простое решение заставляет рой роботов двигаться вместе без ИИ и датчиков
Новости
Вот те Na+: пять плюсов ИБП на натриевых аккумуляторах
Технологии
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости