Сообщить об ошибке на сайте
URL
Ошибка
Мнения

Сет Стивенс-Давидовиц — бывший исследователь больших данных в Google и автор нашумевшей книги «Все лгут. Поисковики, big data и интернет знают о вас все». Он уверен, что человечество доверяет свои секреты больше поисковикам, чем социальным сетям или опросам. И результаты исследования Стивенса-Давидовица ставят неутешительный диагноз: уровень расизма, ксенофобии и ненависти в обществе гораздо выше, нежели мы знаем. «Хайтек» поговорил с исследователем на встрече «Как новые технологии меняют государство» о том, как американцы скрывают ненависть к меньшинствам и как использовать инструменты Google для изучения общественных настроений.

Люди врут себе, но зато честны с Google

— Как цифровые технологии повлияли на мир за последние 10–15 лет?

— Они изменили все. Благодаря Google и Википедии информация доступна при первой необходимости и почти по всем вопросам. Люди гораздо более информированы, чем раньше. И Google сделал самый революционный вклад в это. Конечно, мы говорим по большей части про развитые страны. Но в развивающихся процесс цифровизации движется гораздо быстрее. Когда США и Россия впервые вышли в интернет, он был гораздо более разреженным, чем сейчас. Но когда сегодня развивающаяся страна подключается к сети, — все остальные ее там уже ждут.

— В книге «Все лгут» вы утверждаете, что американцы часто обманывают социологические опросы о своем отношении к расовым или сексуальным меньшинствам. Почему это происходит?

— Самое плохое, что можно сказать об американце, что он или она — расист. Наверное, хорошо, что это настолько неприемлемо. Но из-за этого люди не признаются в этом при опросах. Они могут врать сами себе и просто отказываться честно отвечать социологам. Они ничего не получают за признание этого факта. Зато люди честнее с Google, потому что он может предоставить то, что нужно. Если людям с расистскими взглядами нравятся непристойные шутки про афроамериканцев, им придется загуглить самые свежие. Это — одна из тех вещей, которую обнажил интернет: реальный уровень ненависти, о котором мы не знали раньше. Не думаю, что социальное напряжение как-то выросло с появлением сети. Оно примерно всегда одно и то же. Если какое-то поведение признается неприемлемым, по опросам его всегда будет меньше, чем реально у людей в головах.

— Что большие данные могут нам рассказать о секретах людей?

— Я отслеживал непристойные мысли, которые люди гуглят. В моей книге, например, описывается отношение людей к мусульманам. Инструменты больших данных позволяют смотреть, как запросы «убить мусульман» или «я ненавижу мусульман» появляются во время трансляции речи по телевизору. Видно, какие фразы больше раздражают и злят людей, а какие — меньше. Эти данные можно использовать для двух целей. Хорошие люди могут сказать: «Как нам снизить уровень агрессии?» А плохие, наоборот, попытаются его повысить. Надеюсь, что хороших людей окажется больше и эти инструменты будут служить для снижения ненависти и развития толерантности.

— Кто эти «хорошие» и «плохие» люди, где они работают?

— Во всех областях, где могут применять такие инструменты. Например, я опубликовал одно из своих исследований в New York Times. И через несколько недель администрация Барака Обамы изменила свои публичные высказывания. Я показал, как некоторые слова и действия влияли на людей, недолюбливающих мусульман.

Big Data поможет человечеству успокоиться

— Как вы использовали Google Trends в исследовании?

— Инструмент Google Trends позволяет увидеть, что и где люди ищут в интернете. Данные можно получить по любой стране. Хотя, например, в России он не такой мощный, потому что «Яндекс» имеет большую долю на рынке, чем Google. Дальше я выбираю, где мне применить этот инструмент. Например, в исследовании расизма сразу понятно, что искать: есть один уничижительный эпитет, который используется в отношении афроамериканцев: n-word. Он часто упоминается в шутках, так что попадет в запросы из-за них. Так составляется карта, на которой видно, где таких запросов больше, а где — меньше.

Я делал исследование о психическом здоровье американцев, изучал запросы с упоминанием суицида, депрессии, тревожности. Эти данные могут впоследствии помочь людям, потому что об этом они тоже врут в опросах. Исследователи такие, как я, собирают только анонимные данные. Можно делать какие-то выводы не о конкретном человеке, а о тысячах или десятках тысяч человек, но никогда — на персональном уровне.


«У меня беременная жена»

Очень по-разному люди по всему миру реагируют на беременность своих жен. В Мексике топ-запросы «моя беременная жена» включают фразы frases de amor para mi esposa embarazada (признание в любви моей беременной жене) и poemas para mi esposa embarazada (стихи для моей беременной жены). В Соединенных Штатах топ поисковых запросов состоит из следующих фраз: «Моя жена беременна — и что теперь?» и «Моя жена беременна — что мне делать?».


— А что если большие данные попадут не в те руки?

— Большие данные — не хорошие и не плохие. Но они обладают большим потенциалом. Так редко бывает, что какая-то новая технология — хорошая или плохая сама по себе. Конечно, каждая политическая кампания попробует использовать их для увеличения шансов на победу своего кандидата. И характер использования больших данных в таком случае будет зависеть от того, хороший этот политик или плохой. Ненависть — отличный пример. Думаю, большая часть человечества хочет снизить уровень ненависти, успокоить людей, чтобы они стали лучше относиться друг к другу.

Самое главное при работе с большими данными — умение задавать правильные вопросы, чтобы получить важные выводы. Как нельзя, случайно наведя телескоп на ночное небо, обнаружить там Плутон, — нельзя, просто загрузив кучу данных, открыть тайны человеческой природы.

— Представим, что произошел акт насилия или некий человек ищет способы совершения преступления. Как можно определить: когда нужно нарушить приватность данных и вмешаться в офлайне?

— Нужно быть очень осторожным, если речь идет о вмешательстве на основании запросов в интернете. Одна из вещей, которая понятна из изучения больших данных, — у людей гораздо больше непристойных, скверных мыслей, чем мы думали раньше.

Я уже говорил о суициде. Всегда был вопрос: если вы узнаете, как кто-то собирается покончить с собой, что будете делать? Кто-то отвечает, что нужно поместить таких людей в больницу, пока они не избавятся от суицидальных мыслей. Но благодаря большим данным мы знаем, что огромное число людей, к сожалению, делает запросы о суициде, и нельзя сказать, кто реально на него способен, а кто — просто интересуется.

В США совершается 4 тыс. самоубийств каждый месяц, но делается 3,5 млн запросов о суициде. Невозможно всех этих людей закрыть в больницах — просто не хватит места. Это показывает, что нельзя слишком резко реагировать на мысли людей и их запросы в интернете. То же самое относится к жутким запросам вроде мыслей об убийстве или о теракте.

Прямое общение или слежка?

— Как государства используют большие данные?

— Они часто используются для хороших целей в областях, про которые почти не говорят. Одно из самых мощных направлений — образование. Сервисы Netflix, Amazon или Pandora (сервис потокового воспроизведения музыки, недоступный в России — «Хайтек») — почти волшебные: вы на них получаете ровно то, что нужно. Теперь сравните это со школьной системой. Сколько человек после посещения школы говорят: «Эти уроки — ровно то, что я хотел» или «Материал преподается ровно с той скоростью, с которой мне нужно»? Благодаря большим данным инструменты Netflix, Amazon или Pandora применяются для улучшения эффективности обучения в школе и подгоняют его под каждого ученика персонально.

— Как большие данные и цифровые технологии повлияют на отношения гражданина и государства?

— В идеале государство будет лучше понимать, чего граждане от него хотят. Люди говорят между собой в интернете о чем-то, что им не нравится, например, о дорожных ямах. Эту информацию государство может собирать и выявлять места, где есть проблемы с дорогами. Большие данные открывают значительные возможности для слежки за гражданами, но я все же надеюсь, что их использование повлечет за собой решение проблем. Нужно фокусироваться на том, что действительно хорошо и улучшает взаимодействие в обществе. Например, с помощью Google можно лучше отслеживать сезонные вспышки гриппа, чем традиционными методами.

— «Все лгут» стал бестселлером, в том числе и на русском языке. Что бы вы сказали российским читателям?

— Надеюсь, вы будете использовать эти инструменты для создания более толерантного общества. Например, я много пишу о гомосексуалах в книге. В Штатах сделали несколько шагов вперед в этом направлении, и многие люди, которые скрывали свою сексуальную ориентацию, перестали это делать. Мы видим это по данным, которые собираются анонимно.

Насколько я знаю, мэр одного из российских городов сказал, что у них нет проблем с гомофобией, потому что нет гомосексуалов. Изучая большие данные, я могу вам гарантировать, что это не так.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные
Тренды
Николь Миллс, Booking.com — об инновациях, agile-подходе и индустрии впечатлений
Кейсы
Слишком опасный нанопластик: как одноразовые пакеты превращаются в частицы-убийцы
Тренды
Здесь может быть ваша реклама: НАСА планирует заработать на космосе миллионы
Тренды
Идеи
Человек и квантовая теория: существует ли то, что мы не наблюдаем
Опасный криптотрейдинг: как киберпреступники угрожают виртуальным сбережениям и биржам
Тренды
Как через 20 лет будет выглядеть армия будущего
Тренды
5 финансовых инструментов, которые помогут инвесторам даже после падения криптовалюты
Тренды
Александр Лямин, Qrator Labs: наша задача — выработать у людей цифровую гигиену, чтобы они «не ели с помойки»
Кейсы
Эдуард Фош Вильяронга: люди видят в роботе только внешность, забывая, что он следит за ними
Тренды
Доктор Куэй Во-Райнард, HIT Foundation: если страна требует суверенитета данных, мы построим для нее отдельный блокчейн
Кейсы
Идеи
«Хакинтош»: как собрать свой собственный Mac лучше, чем у Apple
Роботы против мигрантов: какой вклад в ксенофобию и расизм делают технологии ИИ
Тренды
Война скриптов — искусственный интеллект против навязчивой рекламы
Тренды
Как заново изобрести супермаркет: осознанность потребления, этика производства и роботы
Тренды
Каждый человек станет сам себе банком: цифровой мир отказывается от посредников между бизнесом и клиентом
Тренды
Архитектор вычислительной инфраструктуры «Платона» Александр Варламов — о будущем ИТ-индустрии в России, стартапах и разработке
Кейсы
Дмитрий Богданов, капитан сборной России по CS:GO — о стиле жизни киберспортсмена, тренировках и блокировках РКН
Тренды
Идеи
Космос — наш дом: что осталось решить ученым, чтобы поселить человека за пределами Земли
Прайсинг, трекинг, скоринг, биллинг и другие технологии, которые двигают российский бизнес
Тренды
«Педиатр 24/7»: как телемед-стартап подарил родителям спокойствие, а врачам — работу
Кейсы
Вас снова обманули: как человечество учит компьютеры определять фейки в интернете
Тренды
БиСи Бирман, Heavy Projects: ИИ должен иметь несовершенства — это элемент случая
Мнения
Артем Геллер, lab.ag: делая сервис для государства, ты помогаешь своей бабушке
Мнения
Акселераторы и инкубаторы: что выбрать стартапу на раннем этапе развития
Мнения
Вопрос доверия: как и почему изменилось отношение к телемедицине в России
Тренды
Правительственные криптопесочницы: как освободить финтех от давления закона и защитить потребителей
Тренды
Кейсы
Роман Нестер, Segmento: я верю корпорациям больше, чем маленьким компаниям
Суперагенты в недвижимости: как блокчейн и большие данные заменяют риелторов
Тренды
СМИ будущего: вертикальные видео, новости по запросу и смерть сайтов
Тренды
Тренды
Колонизация отменяется: почему терраформирование невозможно на Марсе
Умные города подвергают своих жителей опасности из-за датчиков освещения и радиации
Тренды
Геронтолог Обри ди Грей: жизнь длиной в тысячу лет — это побочный эффект поиска вечного здоровья
Мнения
Биоценоз в фарме: зачем нужна альтернатива антибиотикам и как работают лекарства нового поколения
Тренды
Чарльз Адлер, co-founder Kickstarter: я — панк-рокер, который раздвигает границы
Кейсы
Как ИИ меняет медицину: личный помощник для врачей, маршрутизатор в клиниках и разработчик лекарств
Кейсы
Эдвин Диндер, Huawei Technologies: умный город — это ничто
Мнения
«Если изобретение с ИИ не приносит пользу, сам продукт никому не нужен»
Мнения
Feature engineering: шесть шагов для создания успешной модели машинного обучения
Тренды
Мнения
Человек — это набор из пяти чисел: Игорь Волжанин, DataSine — о психотипировании с помощью big data
Карло Ратти, Senseable City Laboratory (MIT) — о городах будущего, третьей коже человека и роболодках
Тренды
Мы все — сенсоры: CEO SQream Ами Галь — о том, как обрабатывают big data
Кейсы
Что такое скрапинг: как Amazon, Walmart и другие ритейлеры используют ботов в борьбе с конкурентами
Идеи
Почему китайские подлодки-беспилотники станут самым опасным врагом под водой?
Идеи
Филипп Роуд, LSE Cities: самый кошмарный сценарий — беспилотники, ездящие по городу, чтобы не платить за парковку
Мнения
Юрий Корженевский — о том, как построить безопасные системы для банков на блокчейне
Блокчейн
Иннополис
Russian Robot Olympiad: как дети строят роботов и решают реальные инженерные проблемы
MyGenetics: ДНК-тесты, помогающие «взломать» организм, как компьютер
Тренды
Trade-to-Mine: как биржи привлекают трейдеров в условиях падения рынка
Блокчейн