Создан инструмент, который помогает устранить предвзятость компьютерного зрения

Исследователи из Принстонского университета разработали инструмент, который выявляет потенциальные предубеждения в наборах изображений, используемых для обучения систем искусственного интеллекта. Работа является частью более масштабного проекта по исправлению и предотвращению предубеждений, проникших в системы ИИ, которые влияют на все — от кредитных услуг до программ вынесения приговоров в зале суда.

Хотя источники предвзятости в системах ИИ разнообразны, одной из ее основных причин являются стереотипные изображения, содержащиеся в больших наборах данных, собранных из онлайн-источников, которые инженеры используют для развития компьютерного зрения. Это ветвь ИИ, которая позволяет компьютерам распознавать людей, объекты и действия. Поскольку фундамент компьютерного зрения строится на этих наборах данных, изображения, отражающие социальные стереотипы и предубеждения, могут непреднамеренно влиять на модели компьютерного зрения.

Чтобы помочь устранить эту проблему в ее первоисточнике, исследователи из Princeton Visual AI Lab разработали инструмент с открытым исходным кодом, который автоматически обнаруживает потенциальные искажения в наборах визуальных данных. Инструмент позволяет создателям наборов данных и пользователям исправлять проблемы недопредставленности или стереотипного изображения до того, как коллекции изображений будут использоваться для обучения моделей компьютерного зрения. В соответствующей работе члены Visual AI Lab опубликовали сравнение существующих методов предотвращения предвзятости в самих моделях компьютерного зрения и предложили новый, более эффективный подход к снижению предвзятости .

Первый инструмент, называемый REVISE, использует статистические методы для проверки набора данных на предмет потенциальных предубеждений или проблем недопредставленности по трем измерениям: объектному, гендерному и географическому. 

REVISE оценивает содержимое набора данных, используя существующие аннотации к изображениям и такие измерения, как количество объектов, совместное присутствие объектов и людей, а также страны происхождения изображений. Среди этих измерений инструмент выявляет закономерности, которые отличаются от медианного распределения.

В одном наборе данных REVISE выявил потенциальную гендерную предвзятость в изображениях, на которых изображены люди (красные прямоугольники) и орган музыкального инструмента (синие прямоугольники). Анализ распределения предполагаемых трехмерных расстояний между человеком и органом показал, что мужчины, как правило, изображались как фактически играющие на инструменте, тогда как женщины часто просто находились в том же пространстве, что и инструмент. Предоставлено: Princeton Visual AI Lab.

Например, в одном из протестированных наборов данных REVISE показал, что изображения, включающие людей и цветы, различались у мужчин и женщин: мужчины чаще появлялись с цветами на церемониях или встречах, а женщины, как правило, появлялись в постановочных декорациях или картинах. 

Как только инструмент выявляет такого рода несоответствия, «возникает вопрос, является ли это совершенно безобидным фактом или происходит нечто более важное, и это очень трудно автоматизировать», — объясняет Ольга Русаковская, доцент кафедры информатики и главный исследователь Visual AI Lab. 

«Практика сбора наборов данных в компьютерных науках до недавнего времени не изучалась так тщательно», — заключает соавтор исследования Анджелина Ван, аспирантка в области компьютерных наук. Она объясняет, что изображения в основном «берутся из Интернета, и люди не всегда понимают, что их изображения используются [в наборах данных]. Мы должны собирать изображения от более разных групп людей и делаем это уважительно».

Читать также:

Создать термоядерный реактор на Земле реально. Какие будут последствия?

Ледник «Судного дня» оказался опаснее, чем думали ученые. Рассказываем главное

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Экспериментальный лазер передал данные с зонда «Психея» на расстоянии 226 млн километров
Космос
Посмотрите на самое близкое фото обломка ракеты в космосе
Космос
Ученые нашли следы древних ритуалов майя на благословение
Наука
В Китае появились батареи со сверхбыстрой зарядкой для электрокаров: запас хода составляет 1000 км
Новости
Найдены скрытые «дорожки для мертвых»: их обнаружили с помощью лидара
Наука
Беспилотные грузовики Evocargo начинают работу во «Внуково» в рамках эксперимента
Новости
«Человеческие нейронные сети потребляют около 20 Вт, а искусственные — сотни ватт»
Технологии
Ученые считают, что недалеко от Земли есть «живая» планета
Новости
Китай готов к автономным летающим такси: когда будут первые полеты
Новости
Посмотрите на сотни черных «пауков», которые заполонили Марс весной
Космос
Где похоронен Платон: ученые наконец-то нашли ответ
Наука
Почему мужчины умирают в России на 10 лет раньше женщин: в Минздраве назвали причину
Новости
Крошечный и тонкий экран отслеживает активность мозга во время операции
Новости
Российские школьники создают автономную систему для борьбы с браконьерами
Новости
Телескоп НАСА наблюдал сверхновую, которая противоречит современным теориям
Космос
Данные передали со скоростью 25 Мбит/с на расстоянии в 226 000 000 км
Космос
Мертвая звезда осветила мощной вспышкой соседнюю галактику
Космос
Биологи представили альтернативную теорию происхождения строительных блоков жизни
Наука
Биоинженеры спроектировали клетки-киллеры для терапии рака мозга
Наука
Как Process Mining и Task Mining повышают эффективность и прибыльность бизнеса
Мнения