Мнения 8 октября 2019

Мария Чмир, Everypixel Media Innovation Group: «Весь диджитал-маркетинг построен на способах манипулировать нашим вниманием»

Далее

Согласно исследованию агентства Edelman, 65% руководителей технологических компаний считают, что развитие искусственного интеллекта приведет к снижению интеллектуального потенциала человечества. С этими опасениями согласны 71% обычных граждан. Существует и другая точка зрения — что ИИ откроет новый технологический потенциал для человечества, создаст новые рабочие места и избавит от рутинной работы. Chief Product Officer в Everypixel Media Innovation Group Мария Чмир рассказала «Хайтеку» о страхах человека перед ИИ и о его применении в фотографии.

Искусственный интеллект и эстетика

— Я заглянула на сайт и покликала по примерам фотографий, чтобы ваш ИИ их оценил с точки зрения эстетики. И была шокирована результатом. С точки зрения ИИ, любой улыбающийся человек — неэстетичен, это как вообще?

— Первоначальная задача нашего алгоритма — помогать платформам, на которых важную роль играет UGC-контент, быстрее и качественнее модерировать фотографии. И свое представление о прекрасном ИИ формирует, исходя из бизнес-целей. UGC Photo Scoring не оценивает семантику изображения, это делает другой наш алгоритм — Image Keywording, который превращает содержание снимка в текст — теги. ИИ лишь детектирует техническое качество снимка.

— Но такой подход к оценке столь эмпирической величины, как эстетика, был заложен изначально или же является приобретенным?

— Алгоритм — порождение данных, на которых он обучался. Для его создателей он такой же черный ящик, как и для пользователей. Вообще практическая цель любой предобученной модели — объективировать информацию. Но обучаются модели на данных, размеченных людьми, и люди склонны к тому, что называется confirmation bias. В особенности представители творческих профессий, которых мы привлекали для работы с датасетом — это были несколько десятков профессиональных фотографов, дизайнеров, стилистов, арт-директоров и маркетологов, которые выполнили разметку трех сотен тысяч фотографий. Ответы нашей модели — компиляция их оценок.

— Давайте представим ситуацию, что вы смогли научить ИИ снимать фото, в точности следуя его эстетическим критериям. Чтобы он захотел сфотографировать?

— Вопрос не в том, что он сфотографирует, а в том, как это сделает. Он подберет правильные настройки контрастности, яркости и экспозиции, чтобы сделать снимок наиболее качественным. ИИ, который сам выбирает тему съемки и сам снимает (а может быть, даже не снимает, а генерирует изображение), — это уже совсем другой алгоритм, и обучать его следует таким вещам, как мониторинг инфополя, поиск трендов или срочных новостей.

Фото: Everypixel

Он видит новость о протестах в Гонконге, оценивает, насколько она важна и резонансна и направляет туда беспилотник. Или, анализируя поисковые запросы, отмечает, что в последнее время выросло количество людей, интересующихся крикетом, — значит, в фотобанках нужны будут фотографии про этот вид спорта. А еще лучше — на основе определенных паттернов выявляет тренд, который еще даже не сформирован, и предсказывает его. И в этот момент включается целый ряд процессов, они уже совсем не про ИИ — потому что нужно найти модель, связаться с ней, организовать площадку, договориться, выбрать время и так далее.

Искусственный интеллект и люди

— Посмотрим на это с другой стороны: получив, например, негативную оценку своего творения от бездушной машины, насколько человек ей поверит? Или, выражаясь математически, какой процент людей сочтет ее достоверной?

— Когда мы запускали наш первый алгоритм оценки фотографий Everypixel Aesthetics, который был обучен на стоковых снимках и, соответственно, корректно работал только для подобных изображений, то получили неожиданную обратную связь. Специфичный инструмент стал вирусным: сотни тысяч пользователей загружали фото со своих смартфонов и огорчались, когда получали низкие оценки. Один парень писал нам гневные письма, потому что его прекрасная девушка, красивейшая в мире, по его мнению, не получила и 30 баллов.

Как это работает? Мы попросили дизайнеров, фотографов и редакторов оценить базу почти из 947 тыс. фотографий по двум критериям: качественное и некачественное фото. На основе этого датасета мы обучили алгоритмы по некоторому набору признаков (в данном случае это комбинации пикселей и цветов) разделять изображения на эти два класса. Когда пользователь загружает фотографию, нейросеть выделяет присутствие визуальных паттернов (те самые комбинации пикселей и их цветов) и определяет, к какому из двух классов и с какой вероятностью она относится. И процент на выходе — вероятность того, что снимок качественный.

А уже позже появился наш UGC Photo Scoring, который обучен именно на пользовательских, непрофессиональных снимках с менее строгими требованиями к качеству и усложненными критериями ранжирования. Там была 100-процентная шкала, поделенная на пять категорий: от нерезких, смазанных снимков плохого качества (0%) к профессиональным фотографиям безукоризненного качества (100%).

Фото: Everypixel

ИИ неважно, что именно находится на снимке, значимо только то, как сделана фотография — композиция, контрастность, свет/тень, баланс белого и резкость. Кроме задачи модерации, которую я описывала выше, наш алгоритм ранжирует поисковую выдачу, то есть помогает подбрасывать вверх более качественные снимки. Согласитесь, дизайнеру намного удобнее выбирать подходящее изображение среди качественного и релевантного контента, чем тратить время на просмотр неструктурированной массы.

— Следующее поколение фотоаппаратов или смартфонов, оснащенных вашим продуктом, будет оценивать кадр еще до съемки и выдавать рекомендации. Представляю себе это: «У вас скучное лицо, вам никто не даст денег!» или «Этот ребенок портит весь кадр, давайте избавимся от него».

— Да, вы достаточно точно описали то, как сегодня работает камера продвинутого смартфона. Вычислительная фотография — сравнительно новое, но уже прочно вошедшее в нашу реальность явление. То, что начиналось как фильтры для Instagram, которые худо-бедно нивелировали огрехи наших шумных селфи, сделанных на 1,3 мегапикселя, продолжилось enhancing-алгоритмами, и, наконец, дошло до пленоптических технологий захвата светового поля, что открывает для рядовых пользователей впечатляющие возможности как съемки, так и постпродакшна. Это отлично описал в своем блоге Вастрик. Кстати, рекомендую подписаться на его киберпанковый Telegram-канал, в котором много действительно ценной аналитики и свежих мыслей.

— Не получится ли так, что компьютеры будут навязывать нам вкусы и модели?

— Они уже это делают довольно умело (улыбается). Самый эффективный инструмент пропаганды не первую сотню лет — реклама, а весь диджитал-маркетинг построен на алгоритмически выверенных способах манипулировать нашим вниманием.

Искусственный интеллект и бизнес

— Бизнес во многих вопросах строго формализован, и за нарушение многочисленных правил следует наказание. Миллиарды хороших идей умерли просто потому, что их носители не умели вести дела. С другой стороны, ИИ формализован изначально, но начисто лишен идей. Насколько возможна синергия между ними?

— Если мы обратимся к классическому определению понятия «идея», то с обобщением опыта и концептуализацией действительности у алгоритмов все здорово. И к творчеству, созданию нового, ИИ пригоден, что неоднократно уже доказал. В мире искусства масса примеров — от проданной за почти полмиллиона долларов картины генеративно-состязательной нейронной сети «Портрет Эдмонда де Белами» до потрясающих по своей аутентичности произведений в стилистике Скрябина, в написании которых за человеком закрепили роль аранжировщика. Чем не синергия? В бизнесе все не менее интересно: в топе самых перспективных ИИ-решений для B2B — новый проект фаундера ABBYY Давида Яна Yva — сервис, который лучше опытного менеджера по персоналу. Yva подскажет руководителю, когда ключевой сотрудник планирует увольняться. А также people.ai Олега Рогинского, который заменяет коучей по продажам и помогает сейл-директорам повышать КПД от работы своих департаментов. Сейчас мы адаптируем наш UGC Scoring под задачи медиамаркетинга: теперь у специалистов, которые отвечают за конверсионные метрики в соцсетях, появится возможность осмысленно подбирать визуалы к постам и получать рекомендации по улучшению контента для роста показателей.

Фото: Everypixel

— Пару лет назад компания Lexalytics под девизом «Если сотрудники довольны — в компании все идет хорошо» представила свой продукт, семантически анализирующий переписку email, чатов и соцсетей для определения эмоционального настроя авторов. Почему бы не анализировать лица сотрудников прямо в офисе?

— Данная область компьютерного зрения — emotion recognition — направление достаточно продвинутое и конкурентное. В России есть несколько профондированных стартапов, которые успешно применяют свои алгоритмы, прежде всего, в индустриях, связанных с безопасностью и маркетингом. У нас также есть алгоритм, который распознает эмоции на изображениях людей, но он заточен под нужды машины — это классификатор, улучшающий релевантность работы поискового алгоритма. В основе упомянутого вами сценария более комплексные, мультимодальные технологии, которые фиксируют и интерпретируют многообразные реакции человека на внешние раздражители — от широты зрачка, увеличение которого при константном освещении свидетельствует о росте тревожности, до площади мимических морщин и их формы (нейросети тренируют отличать лоб смеющегося человека от плачущего). Алгоритм в данном случае обучают на массиве фотографий плачущих и смеющихся людей. На большой базе этих лиц нейросети выделяют общие паттерны: расположение мимических морщин не только на лбу, но и на всем лице, то, как ведут себя их глаза. Также учитывают биологические проявления эмоционального статуса, передаваемые из других, невизуальных источников — давление, пульс и даже электрическую активность кожи. При таком подходе исследователи могут строить полноценные предиктивные модели, которые позволяют предвосхищать возможные негативные последствия для конкретной персоны и социальной группы — будь то офис частной компании или общественные пространства.

— Любому боссу хотелось бы вербально описать внешний вид логотипа, чтобы ИИ немедленно скомпилировал требуемое изображение с учетом популярности, релевантности и профессиональных требований. Не пора ли вообще похоронить профессию графического дизайнера?

— Мы все-таки верим в коллаборацию технологий и человеческого таланта. Нейросети прекрасны в своей вариативности, и результат их работы специалисты творческих направлений могут использовать в качестве сырья для вдохновения и развития своих креативных идей. А если вы имеете в виду футурологическую страшилку «new technology = job loss» («новые технологии = потеря работы» — «Хайтек»), то стоит обратиться к фактологии. Например, к исследованиям PwC, Deloitte или Mckinsey (есть еще свежий американский репорт) о трансформациях рынка труда: да, нас ожидает исчезновение большого количества рабочих мест в секторах, связанных с ручным, рутинным трудом, но ведь с развитием технологий появляются сверхновые профессии, которые доступны не только выпускникам элитных университетов. Такой борьбы, какая сейчас идет за дата-сайентистов и ML-инженеров, не помнят даже бывалые ИТ-эйчары, а ведь пять-семь лет назад их хантили друг у друга только гиганты из Силиконовой долины.

Искусственный интеллект и государство

— На ваш взгляд, насколько российское государство заинтересовано в подобных технологиях?

— Судя по тому, что сейчас разрабатывается национальная стратегия развития технологий ИИ до 2030 года, государство очень заинтересовано, и на реализацию этой программы планируется потратить 90 млрд рублей за шесть лет. Другое дело, что мы опять в догоняющих: передовые страны уже давно выделяют деньги на развитие ИИ и в больших масштабах, конечно.

Фото: Everypixel

Для сравнения:

Всего на данный момент стратегии внедрения ИИ представили 18 стран. Лидеры отрасли, США и Китай, по-разному подходят к стратегии развития. Если США намерены всего лишь оказывать условия максимального благоприятствования частным компаниям и исследовательским центрам, то КНР еще в июле 2017 года объявила о государственном финансировании программы развития ИИ в размере $17 млрд (108 млрд рублей) только на первом этапе, и планирует к 2030 году вложить в системы машинного обучения до $150 млрд (9,6 трлн рублей). Политика США имеет под собой все основания, так как инвестиции частного бизнеса в исследования в 2018 году выросли до рекордного уровня в $782 млрд (50 трлн рублей).


И проблема не только в деньгах. Эксперты новую стратегию раскритиковали: говорят, что она ориентирована на поддержку крупного и среднего бизнеса, а не маленьких стартапов, что в ней уделяется приоритетное внимание нейроподобным технологиям, тогда как есть хорошие наработки и в других областях. Да и в целом сложно развивать сферу, в которой краеугольное значение имеет доступ к персональным данным, и это тоже нужно как-то решать.

Вопросом этичности использования ИИ в отношениях между государством и обществом задаются во всем мире. Совсем недавно в Сан-Франциско запретили распознавать лица на улицах, потому что это может привести к злоупотреблениям со стороны властей в отношении афроамериканских граждан. При этом есть много удачных кейсов: в Бостоне, например, удалось улучшить транспортную систему для доставки детей в школы, не говоря уже о потенциале ИИ в области медицины. Поэтому нужно регулировать эту новую для правительств сферу, придумывать правила игры и пользоваться возможностями.

— Помимо странной государственной политики по финансированию разработок в области ИИ, что еще сдерживает развитие этого в нашей стране? Отсутствие подготовленных и креативных кадров сильно ощущается?

— Недавно собеседовала инженера из Берлина, который искренне впечатлен уровнем ИИ-продуктов в России. Говорит, в Европе сплошные мартех и финтех, негде развернуться специалисту, ищущему нетривиальных задач. Я не вижу барьеров для того, чтоб создавать инновации в стране, где сосредоточены лучшие математики в мире. Основная проблема высокотехнологичного бизнеса, да и любого другого бизнеса в России — низкая менеджерская культура. Сейчас мы все учимся заполнять вакуум между технологиями state of the art и работающими продуктами, которые приносят понятную, масштабируемую ценность. Да, государство тоже инвестирует в акселерацию этих процессов (речь про инициативы вроде ФРИИ), но мы в самом начале пути.