Иннополис 30 января 2019

Джу Ёнг Ли, Университет Иннополис — о репутации пользователей, измерении доверия и безопасности данных в соцсетях

Социальные платформы стали важнейшим информационным медиумом. Почти невозможно найти человека без странички в Facebook, Instagram или ВКонтакте — количество их пользователей давно измеряется миллиардами. Растет и объем информации, которая попадает в сеть, в том числе личной. На социальных платформах люди принимают множество решений — от того, в каком магазине купить новый смартфон до того, за какую партию проголосовать. Сложную структуру взаимодействий между участниками изучают как исследователи, так и коммерческие организации. Сейчас специальные алгоритмы способны не только предсказать ваши мнения и интересы, но и повлиять на них. «Хайтек» поговорил с главой Лаборатории сетевых наук и информационных технологий Университета Иннополис, доцентом Джу Ёнг Ли о том, как измеряется доверие в соцсетях и насколько ваши данные и убеждения находятся в безопасности.

Читайте «Хайтек» в

Джу Ёнг Ли — глава Лаборатории сетевых наук и информационных технологий Университета Иннополис, доцент. Получила степень PhD в Университете Сиракьюз (США). Имеет опыт работы в университетской среде и индустрии (JPMorgan, Sun Microsystems). Профессор Ли разрабатывает алгоритмы определения активности и репутации пользователей социальных сетей. Ее исследование фокусируется на репутации распределенных вычислений и оценке степени узлов в социальной сети.

Репутация: виртуальная и реальная

Репутация — это восприятие пользователя другими людьми. В реальной жизни это происходит повсеместно. Подозреваете вы об этом или нет, но при первой встрече с человеком у вас есть определенные ожидания или предчувствия относительно него. Затем в процессе разговора или взаимодействия вы обновляете это свое представление. Все эти факторы входят в репутацию.

Репутация — не только про людей, а также про компании, правительственные организации и любые структуры, с которыми мы взаимодействуем. Я нечасто пользуюсь соцсетями и знаю только самые популярные: Facebook и Instagram. В них люди общаются при помощи комментариев и фотографий. Концепция репутации на этих популярных площадках не так широко применяется, поскольку в основном взаимодействия там — межличностные. В Facebook мы не открываем вклад в банке, не совершаем сделки и не распоряжаемся финансами. В широком смысле нам не нужно много доверия для коммуникации на этих платформах, поскольку если наш собеседник окажется плохим человеком, мы не многое потеряем.

В основном репутационная система используется на коммерческих площадках, таких как Amazon и eBay в США или Ozon и Яндекс.Маркет в России. Здесь необходимо доверие между продавцом и покупателем. Если вы платите деньги, а товар не отправляют — вы теряете нечто. Поэтому репутация и доверие важны из экономических соображений. Обычно на этих платформах используют централизованную систему репутации, с которой вы наверняка знакомы. К примеру, у Amazon есть пятизвездочная рейтинговая система, где можно написать продавцу после получения товара и поставить оценку. Это одна из самых распространенных репутационных систем. Она централизована, поскольку берет на себя управление алгоритмом. Если вы поставили три звезды, а затем кто-то другой — четыре или пять, то система автоматически усреднит эти значения и покажет результат остальным пользователям. Такой тип оценки очень эффективен для коммерческих площадок.

Есть также децентрализованные или распределенные системы репутации. Они применяются там, где нет центрального авторитета, например, в одноранговых (peer-to-peer) системах обмена файлами. Здесь нет инстанции, которая расскажет вам о репутации другого пользователя. Но у каждого есть собственное представление о том или ином человеке. Возможно, я взаимодействовала с пользователем, который не отправил мне файл или у него очень медленная связь. А другой мог иметь с ним очень приятный опыт взаимодействия. Так что у нас различные представления об этом человеке и его репутация не является средним арифметических наших мнений.

Я пытаюсь выяснить, какие алгоритмы используются в популярных сетях. Например, Stack Overflow или Quora (популярные системы вопросов и ответов — «Хайтек»). На них вы задаете вопрос, и затем люди на него отвечают. Если ответ становится более популярным, автор увеличивает репутацию. Это общая схема, но каждая платформа использует различные алгоритмы. Обычно их схема основана на обратной связи между взаимодействиями пользователей: если взаимодействие прошло удачно, репутация растет, в обратном случае снижается.

Недавно мы разработали алгоритм, который абсолютно не зависит от этого типа обратной связи. Единственное, что мы используем, — время и частота взаимодействия. То, как часто мы взаимодействуем, действительно влияет на репутацию. Не важно, хорошее это общение или нет, главное — его число и частота. Мы сравнили нашу разработку со стандартным алгоритмом Stack Overflow на одном наборе данных. Выяснилось, что их результаты очень похожи. Это значит, что без знания о восприятии пользователя другими участниками можно достаточно точно определить его репутацию.

ИИ, фейковые аккаунты и агитация

В последнее время соцсети стали важны из-за огромного числа зарегистрированных пользователей. Теперь у политических партий и коммерческих организаций появился новый канал влияния на всех этих людей. Раньше, если какая-либо компания хотела продвигать товар, — она использовала рекламные ролики по ТВ или баннеры на обочине дороги. Но с тех пор, как социальные сети стали популярны, все осознали, что реклама в них гораздо эффективнее. Выстраивать маркетинг внутри соцсети дешевле, а информация распространяется гораздо быстрее. Теперь достаточно создать небольшую новость вместо покупки дорогостоящего ролика на ТВ.

Основную роль в популяризации социальных платформ сыграло молодое поколение. Когда я была моложе, ненавидела читать газеты и прочую прессу. В соцсетях все иначе. Если кто-то скажет, что происходит нечто интересное, — слух распространится очень быстро. Поэтому соцсети и заменили традиционные газеты и журналы.

Сейчас ИИ может создать фейковый аккаунт и вести собственную активность. С тех пор, как социальные площадки стали важным информационным медиумом, их используют для влияния на людей в политических целях. Партии с их помощью стараются переманить людей на свою сторону. Для этого они транслируют выборочную часть информации, которая выгодна для них. Это реализуется при помощи ИИ и алгоритмов обучения. Здесь важно выбрать подходящую группу людей. Если вы хотите, чтобы за вас проголосовали, нужно выбрать правильного человека. Им не должен быть ваш ярый противник или сторонник. Это может дать обратный эффект. Необходимо выбрать людей «на пограничье», которые могут поменять свое мнение. И, конечно, таких людей легко определить на основе их интересов и взаимодействий в соцсетях.

Слежка в соцсетях, Корея и уязвимость личных данных

На больших медиа и социальных платформах невозможно избежать утечки информации. Поскольку, во-первых, вы ее туда помещаете. Во-вторых, даже если крупные компании вроде Facebook утверждают, что не поделятся вашей информацией, их длинное и запутанное пользовательское соглашение, которое на самом деле никто не читает, позволит этому произойти.

Главная проблема в скандале с Cambridge Analytica в том, что аналитическая компания получила доступ к френдлентам и данным всех друзей. Они разработали приложение, которое определяло политические взгляды пользователей. Facebook должен был предоставить информацию только о тех людях, которые им воспользовались. Хотя даже если бы утечка не состоялась, есть множество алгоритмов, которые позволили бы сделать вывод о всей сети, основываясь на данных о ее части.

Передача информации третьим лицам не является чем-то новым или редким. Facebook — это компания, а не НКО, и ей нужно получать прибыль. Для этого приходится делиться частью информации с другими компаниями. Как именно она это делает, сколько и какую информацию отдает, никто не знает. Так что пользователь должен осознавать эту опасность с самого начала. Все, что связано с социальными платформами, появилось недавно. Поэтому правительство не знает, как реагировать на подобные скандалы. Соответствующую политику еще предстоит выработать. Сейчас единственный, кто может защитить ваши данные, — это вы сами. Я не хочу сказать, что не стоит пользоваться соцсетями. Они очень удобны и позволяют найти новых друзей. Но полностью запретить передачу информации третьим лицам не получится — это будет происходить постоянно. Поэтому нам необходим правильный подход к такому виду ситуаций — не на индивидуальном, а на правительственном уровне.

В Корее есть очень популярный мессенджер KakaoTalk. Многие думали, что государство просматривает историю переписки в нем, чтобы узнать, как люди относятся к действующему правительству. В то время некоторые из моих друзей отказались использовать определенные слова. Они искажали имена и слова, чтобы избежать наблюдения. Думаю, во многих странах правительство действительно делает это. Конечно, не признавая публично, поскольку это незаконно. Однако может ли правительство эффективно использовать эту информацию? Если вы обвиняете кого-то на основании фотографии из личного чата, то должны признать, что незаконно наблюдали за этим человеком. Мы никогда не знаем, что на самом деле происходит во внутриправительственных структурах. На индивидуальном уровне нет способа изменить ситуацию.

Располагая достаточным количеством информации можно узнать о человеке все, если это потребуется. Тот же случай с Cambridge Analytica: они лишь разработали приложение — небольшой психологический тест, который делает вывод о личности на основании нескольких вопросов. Это позволило им определить политические данные респондентов и использовать это в предвыборной гонке. Зная, где вы живете, в какой университет ходили, можно определить весь ваш культурный бэкграунд. Даже владея небольшим количеством информации: с кем вы разговариваете, кто дружит с вашими друзьями, — можно сделать вывод о столь многих вещах. Вот почему информация пользователей в соцсетях стала критически важной.

Читать ещё