Новая автоматическая модель распознавания Facebook работает с 51 языками

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На предварительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического распознавания речи (ASR). Она научилась понимать 51 язык после того, как ее обучили на 16 тыс. часов голосовых записей. В статье, опубликованной на сайте Arxiv.org, соавторы работы утверждают, что система, которая содержит около миллиарда параметров, повышает эффективность распознавания речи до 28,8%.

Прежде чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а затем выбрали 10 тыс. единиц словаря в качестве набора информации по каждой языковой группе. После этого они вручную объединили некоторые мелкие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Насколько нам известно, эта первая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру распознавания речи для 51 языка, которая не требует большого количества ресурсов», — отметили в Facebook.

Исследователи сообщают, что в ходе нескольких экспериментов наиболее эффективная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и достигает нужных результатов всего за 10 минут. Ее обучили на 53 тыс. часов «сырых» материалов.


Читайте также

Выяснилось, что заставило цивилизацию майя покинуть свои города

Ученые раскрыли план герпеса по заражению человека: он похож на игру cо ставками

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости
Российских айтишников обяжут преподавать в вузах: кого это коснется
Новости
Киберспорт в России сегодня: плюсы и минусы разных бизнес-моделей
Мнения
Одинокого дельфина нашли в Балтийском море: он «разговаривает» сам с собой
Наука
Физики обнаружили сразу три формы хаоса
Наука
Российского хакера экстрадировали в США за создание вируса-вымогателя
Новости
Ученые впервые раскрыли форму короны черной дыры
Космос
Названы сроки запуска аналога Apple Pay в России
Новости
В России придумали, как искать телефонных мошенников по голосу
Новости
Лазерную связь в космосе предложили использовать, чтобы фотографировать черные дыры
Космос
Чат-бот Google научили запоминать пользователей
Новости
Ген одноклеточного организма возрастом 422 млн лет помог создать живую мышь
Наука