Ботов заставят быть вежливыми: для них разработали антитоксичный алгоритм

По словам автора исследования, их работа будет полезна не только для чат-ботов, но и для диверсификации и детоксикации рекомендательных систем.

Исследователи из Калифорнийского университета в Сан-Диего разработали алгоритмы для очистки речи от оскорбительных выражений, которую генерируют онлайн-боты.

Ранее эксперты пробовали разные подходы для очистки речи ботов, но они оказывались не эффективными. При составлении списка токсичных слов упускаются слова, которые при употреблении вне контекста и по отдельности кажутся нормальными, но становятся оскорбительными при использовании в сочетании с другими. Попытка удалить токсичную речь из обучающих данных отнимает много времени и далеко не надежна. Аналогичные проблемы возникают при разработке нейронной сети, которая выявляла бы токсичную речь.

Теперь специалисты по информатике из Калифорнийского университета в Сан-Диего попробовали новый метод. Сначала они запустили «вредные» подсказки в предварительно обученную языковую модель, чтобы заставить ее генерировать токсичный контент. Затем исследователи обучили модель, которую назвали «злой», прогнозировать вероятность того, что контент будет оскорбительным. После инженеры обучили «хорошую модель», которую научили избегать всего контента, высоко оцененного «злой моделью».

В итоге, авторы разработки подтвердили, что их «хорошая модель» оказалась более эффективна, чем самые современные методы. Исследователи представили свою работу на онлайн-конференции AAAI по искусственному интеллекту.

Читать далее:

За ней охотились столетиями: что нам известно о планете Вулкан рядом с Солнцем

Физики экспериментально подтвердили новый фундаментальный закон для жидкостей

Астрономы нашли источник загадочных радиовсплесков, которые идут из космоса

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найден способ сверхскоростной передачи тепла для быстрого охлаждения электроники
Наука
Условия жизни лошадей в Средневековом Новгороде восстановили по зубам
Наука
Под видом модов для Minecraft и других игр в Telegram распространяют вирусы
Новости
ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
Новости
В России нашли минерал, который поможет изучить ядро Земли и космические тела
Космос
Анализ метеорита поставил под сомнение гипотезу о происхождении воды на Земле
Космос
«Яндекс» научил поиск решать задачи по алгебре для старшеклассников
Новости
Найдена недостающая часть Вселенной: где она скрывалась
Космос
VR в строительстве: как избежать ошибок на сотни миллионов
Мнения
44 планеты, похожие на Землю, нашли в Млечном Пути
Космос
Тайну космоса, которой больше 60 лет, наконец-то раскрыли
Космос
В «дубайском» шоколаде нашли опасные для жизни вещества
Наука
Хакеры атаковали пять оборонных предприятий России
Новости
Как ИИ повышает эффективность и снижает риски обогатительных предприятий
Мнения
«Джеймс Уэбб» изучил загадочные кольца погибшей звезды
Космос
Открыт прием заявок на ежегодную премию Digital Leaders 2025
Новости
GigaChat научился искать информацию в сети: Сбер обновил ИИ-помощника
Новости
Созданы очки с искусственным интеллектом для незрячих людей
Новости
Минобрнауки продолжит программу кешбэка для инвесторов университетских стартапов
Новости
OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов
Новости