Учительницу-нейросеть «Ольгу Станиславовну» научили русскому сленгу и сарказму

Российские программисты разработали нейронную сеть, которая оценивает комментарии пользователей социальных сетей. «Ольга Станиславовна» обладает самым актуальным словарем современного русского сленга, считают создатели.

Разработчики из компании LiveDune, занимающейся аналитикой социальных сетей, создали нейросеть, способную оценивать тональность комментариев в социальных сетях. Программа, которую в честь учительницы директора компании назвали «Ольга Станиславовна», будет работать вместе с филологами.

Искусственный интеллект владеет сразу двумя языками: в меньшей степени русским литературным и в совершенстве сленгом русского языка, сформировавшимся в 2020–2022 годах. Для обучения нейронной сети разработчики использовали словари оценочных слов и матерных выражений. Но основной акцент они сделали не на литературные сборники, а на язык, на котором говорят в социальных сетях.

Для первичного обучения разработчики вручную разметили 10 тыс. русскоязычных комментариев из социальных сетей клиентов компании. После этого сервис запустили в работу, но, как говорят создатели, практически сразу появились жалобы на некорректную работу ИИ. Программа плохо распознавала сарказм, а, например, комментарий: «это чертовски беспонтовый пост» — считала позитивным.

Пример работы сервиса. Изображение: LiveDune

Чтобы дообучить систему, создатели предоставили клиентам возможность корректировать оценку «Ольги Станиславовны». Исправленные данные направляются в систему и применяются для доработки алгоритмов. Фактически нейросеть использовала для обучения более 500 тыс. записей.

Программисты говорят, что сложнее всего было научить «Ольгу Станиславовну» определять иронию и сарказм. Для этого в нейросеть дополнительно загрузили обучающие материалы — словари жаргонизмов и мата. Ну и, конечно, практика на реальных отзывах с обратной связью от пользователей ИИ.

«Ольга Станиславовна» обладает самым актуальным словарным запасом современного русского сленга — языка, на котором общаются в социальных сетях. Только во «ВКонтакте» через нейросеть «прошло» около 20 млн комментариев. Разработчики планируют использовать данные, накопленные системой, для проведения вместе с филологами исследования русского языка.

Заимствования, сокращения и разговорно-просторечные элементы массово используются нами при общении в сети. Словари, фиксирующие языковую норму, всегда отставали от живой речи, но появление такой нейросети может помочь филологам точнее отслеживать развитие языка.

Мария Рогожина, филолог

Читать далее:

Скоро на Землю обрушится солнечная буря: материал летит со скоростью 800 км/с

Ученые сняли на видео странное существо с щупальцами, которое приняли за цветок

Россия покидает МКС: что теперь будет и почему обслуживание станции под угрозой

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
2024 год стал самым жарким за полтора века: впервые превышен предел в 1,5°С
Наука
Юпитер оказался не таким, как считали ученые: открытие опровергает гипотезу о гиганте
Космос
Физики придумали, как найти новые измерения в пространстве
Наука
Посмотрите на первое фото кометы C/2024 G3 в России: она прилетает раз в 160 000 лет
Космос
Ученые нашли необычные частицы: их поведение невозможно объяснить обычной физикой
Наука
Байден запретит поставки ИИ-чипов в Россию: что ответила NVIDIA
Новости
300 млрд киловатт-часов: Китай строит крупнейшую в мире гидроэлектростанцию
Новости
Парниковые газы предложили хранить в стенах домов для борьбы с изменением климата
Наука
Ученые разгадали тайну, как древние птерозавры поднялись в воздух
Наука
Эксперимент показал, что фотоны света могут вести себя как частицы темной материи
Наука
ИИ создал крупнейшую базу данных фотографий северного сияния
Наука
Молекулы РНК превратили в «фонарики», чтобы отслеживать их работу в клетке
Наука
Европейский зонд показал северный полюс Меркурия в рекордных деталях
Космос
Посмотрите, как изменится внешний вид людей через 30 лет  
Наука
Посмотрите на первые фото Tesla Model Y без камуфляжа  
Новости
«Тостер» для смартфона обновляет зарядку гаджета за секунды
Новости
Гаджет, который научился читать мысли человека, показали на CES 2025
Новости
Эта камера будет снимать на Луне: Nikon представила прототип на CES 2025  
Новости
Ярчайший гамма-всплеск в истории связали с теорией струн и темной материей  
Новости
Наука в фокусе: кто и зачем делает научно-популярные видеоблоги в России
Кейсы