Ботов заставят быть вежливыми: для них разработали антитоксичный алгоритм

По словам автора исследования, их работа будет полезна не только для чат-ботов, но и для диверсификации и детоксикации рекомендательных систем.

Исследователи из Калифорнийского университета в Сан-Диего разработали алгоритмы для очистки речи от оскорбительных выражений, которую генерируют онлайн-боты.

Ранее эксперты пробовали разные подходы для очистки речи ботов, но они оказывались не эффективными. При составлении списка токсичных слов упускаются слова, которые при употреблении вне контекста и по отдельности кажутся нормальными, но становятся оскорбительными при использовании в сочетании с другими. Попытка удалить токсичную речь из обучающих данных отнимает много времени и далеко не надежна. Аналогичные проблемы возникают при разработке нейронной сети, которая выявляла бы токсичную речь.

Теперь специалисты по информатике из Калифорнийского университета в Сан-Диего попробовали новый метод. Сначала они запустили «вредные» подсказки в предварительно обученную языковую модель, чтобы заставить ее генерировать токсичный контент. Затем исследователи обучили модель, которую назвали «злой», прогнозировать вероятность того, что контент будет оскорбительным. После инженеры обучили «хорошую модель», которую научили избегать всего контента, высоко оцененного «злой моделью».

В итоге, авторы разработки подтвердили, что их «хорошая модель» оказалась более эффективна, чем самые современные методы. Исследователи представили свою работу на онлайн-конференции AAAI по искусственному интеллекту.

Читать далее:

За ней охотились столетиями: что нам известно о планете Вулкан рядом с Солнцем

Физики экспериментально подтвердили новый фундаментальный закон для жидкостей

Астрономы нашли источник загадочных радиовсплесков, которые идут из космоса

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Квантовые симуляторы: объяснение от ученого
Мнения
Источник в СМИ назвал возможную причину сбоя рунета
Новости
Мошенники начали выдавать себя за начальников в рабочих чатах: как это работает
Новости
Холодные атомы этого металла могут создавать новые состояния материи
Наука
Древние артефакты в Украине раскрыли тайны навигации викингов
Наука
Послушайте, как звучат вспышки на Солнце: данные собрал Solar Orbiter  
Космос
Тяжелый беспилотник на водородных топливных ячейках впервые испытали в Китае
Новости
Ученые создали катализатор, который нарушает законы физики
Наука
Физики обнаружили необычные магнитные свойства в трехслойном графене
Наука
Биоинженеры создали ДНК-робота, который может менять форму искусственной клетки
Наука
«Горы» на нейтронных звездах могут вызывать рябь в пространстве-времени
Космос
На телах древних мумий из Перу нашли сложные узоры татуировок
Наука
У черной дыры прячется белый карлик, движущийся с половиной скорости света
Космос
Стартап из России разрабатывает нанопротез для восстановления поврежденных нервов
Наука
Генетики разгадали секреты выживания устойчивой к антибиотикам бактерии
Наука
Астрофизики разгадали тайну космических ускорителей частиц
Космос
Илон Маск: Neuralink поставил мозговой имплант третьему пациенту
Новости
В Китае дроны вызвали снегопад в горах, чтобы решить проблему с недостатком воды
Новости
«Сестра Клеопатры» оказалась римским больным подростком
Наука
2024 год стал самым жарким за полтора века: впервые превышен предел в 1,5°С
Наука