Ученые обучили ИИ распознаванию речи в Twitter и Urban Dictionary

Исследователи создали алгоритм, который умеет распознавать диалекты, сленг и язык, которым обычно общаются люди в интернете. Его обучили на Википедии, Urban Dictionary и Twitter.

Исследователи из Стэнфордского университета создали «социально справедливый» инструмент обработки естественного языка. Он учитывает даже региональные диалекты и сленг, пишет VentureBeat.

Новый инструмент под названием Equilid, по данным разработчиков, является более точным, чем обычно используемые средства идентификации, такие как langid.py и CLD2 от Google. Equilid был создан для того, чтобы лучше понимать сленг, региональные диалекты и язык общения людей в интернете, особенно когда они переключаются между языками.

Equilid обучали на Википедии, Urban Dictionary, Twitter, новостных сайтах. Он может распознавать почти 98 млн твиттов от 1,5 млн пользователей на 53 языках. По мнению разработчиков, более эффективная идентификация языка может даже помочь выявлять опасные тенденции в развитии инфекционных заболеваний. Кроме того, он повышает точность распознавания речи и может находить закономерности — к примеру, идентифицировать предубеждения против расы или пола.

Следующее поколение интернет-пользователей будет безграмотным

Весной этого года IBM удалось снизить долю ошибок в компьютерном распознавании речи до 5,5%, и это стало новым рекордом. Ранее искусственный интеллект компании показывал результат в 6,9%, а прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Путин подписал закон против кибермошенничества: что изменится для россиян
Новости
Генератор изображений OpenAI теперь доступен бесплатно, но с ограничениями  
Новости
Apple готовит iOS 19: какие iPhone не получится обновить  
Новости
ЦЕРН представил проект нового коллайдера: что известно прямо сейчас
Наука
На «Госуслугах» запустили сервис для проверки сим-карт: как он работает  
Новости
В России введут маркировку электроники: это изменится для покупателей
Новости
Разработан мозговой имплант, который переводит мысли в речь почти мгновенно
Новости
«Хаббл» зафиксировал драматические сезонные изменения в атмосфере Урана
Космос
Физики МГУ придумали, как ускорить память компьютера терагерцовым излучением
Новости
Клетки жажды: нейробиологи выяснили, как мозг решает, когда нужно пить и есть
Наука
Разработчик ChatGPT анонсировал первую за пять лет модель с открытым кодом
Новости
«Казнить нельзя помиловать»: запятые и точки влияют на точность работы ИИ
Новости
Живые клетки обрабатывают информацию в миллиарды раз быстрее, чем считалось ранее
Наука
Яндекс опубликовал нейросеть YandexGPT 5 Lite в открытом доступе
Новости
Эксперты обсудили управление персоналом в эпоху цифровых технологий
Новости
Роспотребнадзор опроверг информацию о новом опасном вирусе в России
Новости
Последствия невесомости для скелета изучили на мышах-космонавтах
Космос
Томские химики создали экономичные катализаторы для зеленой промышленности
Наука
Ученые создали перчатку, с которой можно «ощущать» объекты в виртуальной реальности
Наука
Ученые в тупике: «Уэбб» засек невозможный свет в галактике
Космос