Сет Стивенс-Давидовиц: у людей гораздо больше непристойных и скверных мыслей, чем мы думали

Сет Стивенс-Давидовиц — бывший исследователь больших данных в Google и автор нашумевшей книги «Все лгут. Поисковики, big data и интернет знают о вас все». Он уверен, что человечество доверяет свои секреты больше поисковикам, чем социальным сетям или опросам. И результаты исследования Стивенса-Давидовица ставят неутешительный диагноз: уровень расизма, ксенофобии и ненависти в обществе гораздо выше, нежели мы знаем. «Хайтек» поговорил с исследователем на встрече «Как новые технологии меняют государство» о том, как американцы скрывают ненависть к меньшинствам и как использовать инструменты Google для изучения общественных настроений.

 

Люди врут себе, но зато честны с Google

— Как цифровые технологии повлияли на мир за последние 10–15 лет?

— Они изменили все. Благодаря Google и Википедии информация доступна при первой необходимости и почти по всем вопросам. Люди гораздо более информированы, чем раньше. И Google сделал самый революционный вклад в это. Конечно, мы говорим по большей части про развитые страны. Но в развивающихся процесс цифровизации движется гораздо быстрее. Когда США и Россия впервые вышли в интернет, он был гораздо более разреженным, чем сейчас. Но когда сегодня развивающаяся страна подключается к сети, — все остальные ее там уже ждут.

 

 

 

 

Человек — это набор из пяти чисел: Игорь Волжанин, DataSine — о психотипировании с помощью big data

 

 

 

 

— В книге «Все лгут» вы утверждаете, что американцы часто обманывают социологические опросы о своем отношении к расовым или сексуальным меньшинствам. Почему это происходит?

— Самое плохое, что можно сказать об американце, что он или она — расист. Наверное, хорошо, что это настолько неприемлемо. Но из-за этого люди не признаются в этом при опросах. Они могут врать сами себе и просто отказываться честно отвечать социологам. Они ничего не получают за признание этого факта. Зато люди честнее с Google, потому что он может предоставить то, что нужно. Если людям с расистскими взглядами нравятся непристойные шутки про афроамериканцев, им придется загуглить самые свежие. Это — одна из тех вещей, которую обнажил интернет: реальный уровень ненависти, о котором мы не знали раньше. Не думаю, что социальное напряжение как-то выросло с появлением сети. Оно примерно всегда одно и то же. Если какое-то поведение признается неприемлемым, по опросам его всегда будет меньше, чем реально у людей в головах.

 

 

— Что большие данные могут нам рассказать о секретах людей?

— Я отслеживал непристойные мысли, которые люди гуглят. В моей книге, например, описывается отношение людей к мусульманам. Инструменты больших данных позволяют смотреть, как запросы «убить мусульман» или «я ненавижу мусульман» появляются во время трансляции речи по телевизору. Видно, какие фразы больше раздражают и злят людей, а какие — меньше. Эти данные можно использовать для двух целей. Хорошие люди могут сказать: «Как нам снизить уровень агрессии?» А плохие, наоборот, попытаются его повысить. Надеюсь, что хороших людей окажется больше и эти инструменты будут служить для снижения ненависти и развития толерантности.

— Кто эти «хорошие» и «плохие» люди, где они работают?

— Во всех областях, где могут применять такие инструменты. Например, я опубликовал одно из своих исследований в New York Times. И через несколько недель администрация Барака Обамы изменила свои публичные высказывания. Я показал, как некоторые слова и действия влияли на людей, недолюбливающих мусульман.

 

 

Big Data поможет человечеству успокоиться

— Как вы использовали Google Trends в исследовании?

— Инструмент Google Trends позволяет увидеть, что и где люди ищут в интернете. Данные можно получить по любой стране. Хотя, например, в России он не такой мощный, потому что «Яндекс» имеет большую долю на рынке, чем Google. Дальше я выбираю, где мне применить этот инструмент. Например, в исследовании расизма сразу понятно, что искать: есть один уничижительный эпитет, который используется в отношении афроамериканцев: n-word. Он часто упоминается в шутках, так что попадет в запросы из-за них. Так составляется карта, на которой видно, где таких запросов больше, а где — меньше.

Я делал исследование о психическом здоровье американцев, изучал запросы с упоминанием суицида, депрессии, тревожности. Эти данные могут впоследствии помочь людям, потому что об этом они тоже врут в опросах. Исследователи такие, как я, собирают только анонимные данные. Можно делать какие-то выводы не о конкретном человеке, а о тысячах или десятках тысяч человек, но никогда — на персональном уровне.

 


«У меня беременная жена»

 

Очень по-разному люди по всему миру реагируют на беременность своих жен. В Мексике топ-запросы «моя беременная жена» включают фразы frases de amor para mi esposa embarazada (признание в любви моей беременной жене) и poemas para mi esposa embarazada (стихи для моей беременной жены). В Соединенных Штатах топ поисковых запросов состоит из следующих фраз: «Моя жена беременна — и что теперь?» и «Моя жена беременна — что мне делать?».

 


 

— А что если большие данные попадут не в те руки?

— Большие данные — не хорошие и не плохие. Но они обладают большим потенциалом. Так редко бывает, что какая-то новая технология — хорошая или плохая сама по себе. Конечно, каждая политическая кампания попробует использовать их для увеличения шансов на победу своего кандидата. И характер использования больших данных в таком случае будет зависеть от того, хороший этот политик или плохой. Ненависть — отличный пример. Думаю, большая часть человечества хочет снизить уровень ненависти, успокоить людей, чтобы они стали лучше относиться друг к другу.

 

Самое главное при работе с большими данными — умение задавать правильные вопросы, чтобы получить важные выводы. Как нельзя, случайно наведя телескоп на ночное небо, обнаружить там Плутон, — нельзя, просто загрузив кучу данных, открыть тайны человеческой природы.

 

— Представим, что произошел акт насилия или некий человек ищет способы совершения преступления. Как можно определить: когда нужно нарушить приватность данных и вмешаться в офлайне?

— Нужно быть очень осторожным, если речь идет о вмешательстве на основании запросов в интернете. Одна из вещей, которая понятна из изучения больших данных, — у людей гораздо больше непристойных, скверных мыслей, чем мы думали раньше.

Я уже говорил о суициде. Всегда был вопрос: если вы узнаете, как кто-то собирается покончить с собой, что будете делать? Кто-то отвечает, что нужно поместить таких людей в больницу, пока они не избавятся от суицидальных мыслей. Но благодаря большим данным мы знаем, что огромное число людей, к сожалению, делает запросы о суициде, и нельзя сказать, кто реально на него способен, а кто — просто интересуется.

В США совершается 4 тыс. самоубийств каждый месяц, но делается 3,5 млн запросов о суициде. Невозможно всех этих людей закрыть в больницах — просто не хватит места. Это показывает, что нельзя слишком резко реагировать на мысли людей и их запросы в интернете. То же самое относится к жутким запросам вроде мыслей об убийстве или о теракте.

Прямое общение или слежка?

— Как государства используют большие данные?

— Они часто используются для хороших целей в областях, про которые почти не говорят. Одно из самых мощных направлений — образование. Сервисы Netflix, Amazon или Pandora (сервис потокового воспроизведения музыки, недоступный в России — «Хайтек») — почти волшебные: вы на них получаете ровно то, что нужно. Теперь сравните это со школьной системой. Сколько человек после посещения школы говорят: «Эти уроки — ровно то, что я хотел» или «Материал преподается ровно с той скоростью, с которой мне нужно»? Благодаря большим данным инструменты Netflix, Amazon или Pandora применяются для улучшения эффективности обучения в школе и подгоняют его под каждого ученика персонально.

 

 

— Как большие данные и цифровые технологии повлияют на отношения гражданина и государства?

— В идеале государство будет лучше понимать, чего граждане от него хотят. Люди говорят между собой в интернете о чем-то, что им не нравится, например, о дорожных ямах. Эту информацию государство может собирать и выявлять места, где есть проблемы с дорогами. Большие данные открывают значительные возможности для слежки за гражданами, но я все же надеюсь, что их использование повлечет за собой решение проблем. Нужно фокусироваться на том, что действительно хорошо и улучшает взаимодействие в обществе. Например, с помощью Google можно лучше отслеживать сезонные вспышки гриппа, чем традиционными методами.

 

 

 

 

Мы все — сенсоры: CEO SQream Ами Галь — о том, как обрабатывают big data

 

 

 

 

— «Все лгут» стал бестселлером, в том числе и на русском языке. Что бы вы сказали российским читателям?

— Надеюсь, вы будете использовать эти инструменты для создания более толерантного общества. Например, я много пишу о гомосексуалах в книге. В Штатах сделали несколько шагов вперед в этом направлении, и многие люди, которые скрывали свою сексуальную ориентацию, перестали это делать. Мы видим это по данным, которые собираются анонимно.

Насколько я знаю, мэр одного из российских городов сказал, что у них нет проблем с гомофобией, потому что нет гомосексуалов. Изучая большие данные, я могу вам гарантировать, что это не так.

 

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости