Microsoft удалила базу данных из 10 млн изображений, которая использовалась для обучения систем распознавания лиц, сообщает Financial Times. База данных была выпущена в 2016 году и состояла из фотографий известных людей, которые не давали свое разрешение на это.
Предполагается, что эта база данных использовалась для подготовки нейросетей к работе. С ней работали сразу множество компаний, потому что база включала в себе огромное количество изображений.
В Microsoft рассказали, что база данных больше недоступна, потому что человек, курировавший ее, покинул компанию. В прошлом году президент Microsoft Брэд Смит попросил Конгресс США взять на себя задачу регулирования использования систем распознавания лиц, поскольку они имеют «широкие социальные последствия и потенциал для злоупотреблений».
База данных лиц включала в себя фотографии американских и британских актеров, которые «должны поддерживать присутствие в интернете для своей профессиональной жизни». Это означает, что в ее состав входят журналисты, художники, музыканты, активисты, политики, писатели и исследователи.
Несмотря на то, что эти данные больше не доступны в Microsoft, они, вероятно, все еще используются людьми, загрузившими копию. «Вы не можете просто удалить набор данных, — отметил Адам Харви из проекта Megapixel. — Как только вы опубликуете его и люди скачают его, он появится на жестких дисках по всему миру».