Ученые обучили ИИ распознаванию речи в Twitter и Urban Dictionary

Исследователи создали алгоритм, который умеет распознавать диалекты, сленг и язык, которым обычно общаются люди в интернете. Его обучили на Википедии, Urban Dictionary и Twitter.

Исследователи из Стэнфордского университета создали «социально справедливый» инструмент обработки естественного языка. Он учитывает даже региональные диалекты и сленг, пишет VentureBeat.

Новый инструмент под названием Equilid, по данным разработчиков, является более точным, чем обычно используемые средства идентификации, такие как langid.py и CLD2 от Google. Equilid был создан для того, чтобы лучше понимать сленг, региональные диалекты и язык общения людей в интернете, особенно когда они переключаются между языками.

Equilid обучали на Википедии, Urban Dictionary, Twitter, новостных сайтах. Он может распознавать почти 98 млн твиттов от 1,5 млн пользователей на 53 языках. По мнению разработчиков, более эффективная идентификация языка может даже помочь выявлять опасные тенденции в развитии инфекционных заболеваний. Кроме того, он повышает точность распознавания речи и может находить закономерности — к примеру, идентифицировать предубеждения против расы или пола.

Следующее поколение интернет-пользователей будет безграмотным

Весной этого года IBM удалось снизить долю ошибок в компьютерном распознавании речи до 5,5%, и это стало новым рекордом. Ранее искусственный интеллект компании показывал результат в 6,9%, а прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Телескоп запечатлел столкновение галактик на скорости 3,2 млн км/ч
Космос
Укус вместо укола: создана вакцина от малярии, распространяемая комарами
Наука
Физики определили форму отдельного фотона
Наука
Создатели ChatGPT планируют выпустить собственный браузер
Новости
Плотность промышленных роботов в мире удвоилась за семь лет
Новости
В Гибралтаре нашли «фабрику», на которой неандертальцы варили клей
Наука
Nvidia раскрыла, какие товары компании будут в дефиците и когда
Новости
Посмотрите на первое в истории фото звезды из другой галактики
Космос
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости
Российских айтишников обяжут преподавать в вузах: кого это коснется
Новости
Киберспорт в России сегодня: плюсы и минусы разных бизнес-моделей
Мнения