Исследователи представили алгоритм, который определяет «оскорбительные» материалы для машинного обучения

Система будет следить за тем, чтобы ИИ не продолжил транслировать стереотипы из материала, на котором он обучался.

В статье «Каковы предубеждения во встраивании слов?», опубликованной на сервере препринтов arXiv.org, ученые из Microsoft Research, Карнеги — Меллон и Университета Мэриленда описывают алгоритм, который может выявить «оскорбительные ассоциации», связанные с деликатными вопросами — такими как гендер и раса.

Их работа основана на исследовании Калифорнийского университета, в котором подробно описывается учебное решение, способное «сохранять [гендерную информацию]» в словарных векторах, «заставляя другие аспекты быть свободными от гендерного влияния».

«Мы рассматриваем проблему подсчета неконтролируемого смещения (UBE), автоматически обнаруживая смещения смысла, — пишут исследователи. — Существует множество причин, по которым можно использовать такой алгоритм. Во-первых, социологи могут использовать его в качестве инструмента для изучения предвзятости человека. Во-вторых, выявление предвзятости является естественным шагом в «искажении» представлений. Наконец, это может помочь избежать систем, которые увековечивают эти предубеждения — мы бы не хотели исправлять их во множестве систем, которые позже окажутся на рынке».

«Невозможно вручную написать всевозможные тесты, чтобы проверить нейтральность материала для машинного обучения. Специалисты по предметным областям обычно создают такие тесты, и нецелесообразно ожидать, что они охватят все возможные группы, особенно если они не знают, какие группы представлены в их данных», — отмечают исследователи.

Чтобы протестировать систему, ученые взяли наборы слов из базы данных Администрации социального обеспечения (SSA), стараясь удалить из них слова, которые обладают сразу несколькими значениями. После того, как ИИ проверил нейтральность выражений, их повторно отсмотрели вручную. Оказалось, что алгоритм смог определить более 90% выражений, контекст которых был смещен и мог быть оскорбительным.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Индийская космическая обсерватория наблюдала «рождение» солнечной вспышки
Космос
Алгоритм от MIT определяет, когда конкурентам выгодно сотрудничать
Новости
Microsoft закрывает Skype: пользователям предлагают перебраться в Teams
Новости
Пользователи из России жалуются на сбой WhatsApp
Новости
У двух космических станций, запущенных вместе с лунным модулем, возникли проблемы
Космос
Разгадана тайна растительной диеты панд: почему они выбирают бамбук, вместо мяса
Наука
Z-флипоны: ученые раскрыли функции загадочных участков ДНК
Наука
Найдена планета, которая не должна существовать: как она выживает
Космос
WhatsApp оштрафовали в России на 17 млн рублей: в чем причина
Новости
Физики впервые наблюдали загадочный фрактальный узор в скрученном графене
Наука
Редчайшие кадры: ученые впервые засняли, как детеныши белых медведей покидают берлогу  
Наука
Ученые сделали шаг к созданию робота Т-1000, как в «Терминаторе» 
Новости
Китай рассекретил первый в мире спутник радиолокационного наблюдения  
Космос
Пепел Везувия превратил мозг древнего римлянина в стекло
Наука
Создан асфальт, который сам устраняет трещины с помощью спор растений
Наука
«Слизкие» белки могут защитить мозг от старения, показало исследование
Наука
«Первая частная компания на Луне» отправила новую миссию к спутнику
Космос
Физики обнаружили экзотические кристаллы электронов в сверхтонком материале
Наука
Создана нейросеть, которая подбирает лучший ИИ для разных задач
Новости
Kotlin vs Java: история конкуренции в мобильной разработке
Мнения