Мнения 18 мая 2022

Анна Маикова, Picsart: «Через 5 лет нейросети будут генерировать 90% всей графики»

Далее

Еще 10 лет назад никто не мог представить, что нейронные сети смогут генерировать картинки, которые сложно отличить от авторских. Но визуальные технологии входят в нашу жизнь очень активно — и это происходит не только в социальных сетях и модных приложениях, но и в «полезных» сферах. Анна Маикова, руководитель маркетинга приложения для творческого редактирования фото и видео PicsArt, рассказала «Хайтеку» о том, как VR и AR помогают нам не только развлекаться, но и решать вопросы жизни и смерти.

«О VR и AR в машиностроении, строительстве и медицине говорят очень мало»

— Что такое Visual Tech?

— Это технология или область инженерных технологий, которые связаны с визуальным восприятием объектов. Обычно к ним относят фото-видео индустрию, печать и смешанные технологии вроде мультимедиа и кино.

Visual Tech относится ко всему, что нас окружает и куда смотрит наш глаз. Это все, что мы видим в телефоне, воспринимаем в социальных сетях или интернете — картинки, мемы, материалы. Есть и более практичное применение — любые снимки, в том числе медицинские, в бизнесе — это аудио- и видеотехнологии.

Я начала интересоваться этим, потому что мне нравится работать с эстетикой и визуальным вокруг себя — считаю, что все, что нас окружает, должно быть красивым.

Анна Маикова

— Какие самые передовые технологии используются в этой сфере?

— Большой упор в Visual Tech идет на дополненную и виртуальную реальность (VR и AR). Эти технологии пока в активной разработке, но будут использоваться везде через 5 лет. Когда я работала в компании WayRay, мы занимались автомобилями Porsche и Hyundai, которые появятся на дорогах только к 2027 году. Это долгий процесс, потому что нужно пройти все уровни сертификации. Но по факту это автомобиль будущего — в нем навигация накладывается впереди автомобиля прямо на дорогу, в 15 метрах от глаз. Идея в том, что когда мы водим автомобиль, мы смотрим не на лобовое стекло, а на 10–15 метров вперед. Туда как раз и накладывается дополненная реальность.

Что касается будущего применения, учитывая, что технология будущего — это беспилотные автомобили, такая технология позволит водителю, которому уже не нужно управлять машиной, потреблять контент во время поездки. Он может ехать и смотреть, что есть в городе, какие рядом есть магазины.

Большие компании уже думают, как использовать эту ситуацию — например, пассажир может смотреть рекламу внутри автобуса и автомобилей, а компания будет спонсировать эту поездку, для пользователя поездка будет бесплатной.

«Большой упор в Visual Tech идет на дополненную и виртуальную реальность (VR и AR)»

— Есть статистика по тому, как применяют AR и VR — в топе идут развлечения и продажи, а не что-то полезное. Как эти технологии можно использовать во благо?

— Да, действительно, больше визуальной репрезентации этих технологий есть в соцсетях — таких, как Snapchat. Но о них говорят больше всего, мало говорится о технологиях в машиностроении, строительстве и медицине. Хотя применение очень обширное: доктор, например, может надеть очки, когда делает операцию, а AR будет показывать, где находится сердце и другие важные органы. Это применение, которое может спасти жизни.

В машиностроении тоже используют моделирование разных объектов, например, при учебе, когда проводят тренинги для инженеров, в которых нет возможности реальной практики. Я как раз занимаюсь тем, что рассказываю про такие кейсы. Потому что люди могут подумать, что VR и AR можно использовать для развлечений или других простых вещей.

— Может, проблема в том, что в Snapchat эти технологии можно использовать быстрее, а разработки для автомобилей нужно одобрять у регуляторов?

— Основная проблема — легальная база. Для автономных автомобилей нет регуляции, ее нужно создавать параллельно. Очень большой барьер — законодательная база. Также важен этический момент. Мы делали большую статью, где задавались теоретическим вопросом — что будет выбирать автономный автомобиль в опасной ситуации — сохранит водителя, который заплатил за машину 100 тыс. долларов, или сохранит больше жизней? Здесь идет междисциплинарная работа юристов, психологов и инженеров и только потом ложится в законодательную базу. Я помогаю стимулировать диалог людей из разных дисциплин.

«На Западе больше конкуренции — там гораздо больше информации, раз в 15 больше, чем в России»

— Учитывая, что ваша задача — продвигать и продавать новые технологии, как обычные люди относятся к ней? Какие у них есть предубеждения?

— Эту проблему я решаю с помощью выставок — например, я делала стенд на Всемирной выставке электроники в Лас-Вегасе, где мы презентовали новую AR-технологию, встроенную в лобовое стекло. На такие событие приходит более подготовленная публика и люди знают вокабуляр, они понимают, что эта технология не появится на рынке прямо сейчас, но уже через несколько лет они смогут ею воспользоваться.

А когда я делала Женевский автосалон, приходили ребята, которые просто выбирали себе новые машины. Например, однажды я очень долго рассказывала человеку про AR, а он в конце спросил: «А что такое AR, как это расшифровывается?» Тогда я поняла, что он очень вежливо меня слушал, но вообще не понял, о чем идет речь. Это и есть моя работа — в сотый раз рассказать про технологию, про ее плюсы и минусы, посмотреть, интересно ли людям, какие вопросы они задают, какие переживания у них есть по поводу этой технологии. Почему они боятся ее?

«В автомобиле будущего навигация накладывается впереди автомобиля прямо на дорогу, в 15 метрах от глаз»

— Кто ваша целевая аудитория? Кто воспринимает эту технологию лучше?

— Любая технология не может быть для всех, у нее есть целевая аудитория. Быстрее всех к тебе придут новаторы и ранние последователи. В случае AR и VR — это мужчины 21–30 лет, они самые продвинутые, потому что им очень нравится в этом разбираться. Но это не значит, что технологией будут пользоваться только они. Дальше это уже, конечно, и женщины такой же возрастной группы и те люди, которые покупают автомобиль и следят за технологиями.

В Picsart больший упор на Gen Z, молодых людей, которые не выпускают смартфон из рук. Но это не значит, что нужно работать только на одну аудиторию, это только те, кто быстрее нас понимает.

— А разница между работой с российской и зарубежной аудиторией у вас есть? Как вы продаете технологии здесь и там, какими тезисами пользуетесь?

— Да, персоны очень сильно отличаются. Ключевой момент — разработка персон с возрастом, городом, интересами, с кем мы общаемся. На Западе больше конкуренции — там гораздо больше информации, может быть, раз в 15 больше, чем в России. Поэтому пробиться в СМИ, выставки, к инвесторам — очень сложно.

Я работаю с разными рынками, и если сравнивать с Японией, аудитория там очень хорошо схватывает, а возрастной барьер там больше, чем в России или США.

«Скоро мы будем диктовать запросы, а алгоритм выдаст нужную картинку»

— Для кого вы делаете Picsart?

— У нас очень большой фокус на просьюмеров, которые создают контент не для развлечения, а для бизнеса. Это может быть блогер, который продвигает себя или у него есть небольшой бизнес. Мы помогаем им сократить издержки на дизайнера или человека, который создает макеты для социальных сетей. Для мелкого и среднего бизнеса мы запустили веб-платформу, где можно сделать большой баннер или свой мерч.

Для этого мы используем ИИ и наращиваем потенциал в этой сфере. Здесь идет кросс-культурная работа специалистов из России, Китая, США. Это как раз те страны, где находится мощь искусственного интеллекта. Также работаем с GAN, используя который, можно никуда не нажимать, ничего не редактировать, а сказать «макет дерева» и получить готовую картинку.

— Что сейчас можно делать на платформе?

— Пока в одном приложении можно сделать макеты фото и видео. Там уже подключены все фотостоки, можно написать текст — и макет готов. У нас 150 млн активных пользователей в месяц. Они заходят каждый день и что-то редактируют в телефоне. Но, конечно, в приложении уже есть технология распознавания лица по точкам. Это сочетание текущих технологий — ИИ, который уже распознал тысячи снимков лица.

«Пока в одном приложении можно сделать макеты фото и видео»

— Как создаются такие технологии? Кто участвует в их разработке?

— В последних двух компаниях, где я работала, были специальные лаборатории. В WayRay — лаборатория, где работает биолог глаза, оптический инженер, практически все лучшие студенты Бауманки тогда уходили в эту компанию, они лучше всех знают, как работает линза и как свет преображается, проходя через стекло. И дальше с этим работает инженер компьютерного зрения — человек, который может генерировать картинку. После этого начинают работать 3D-дизайнеры, которые визуализируют рисунок.

В Picsart тоже работает лаборатория искусственного интеллекта, где сканируют разные типы лица. Так как мы работаем на весь мир, нам важно анализировать разные лица, пусть и кажется, что у всех одинаковые черты. Сейчас мы готовим инновационный селфи-редактор — нажал на кнопку — и в 3D наложился макияж. Для этого нужно отсканировать несколько сотен лиц разного типажа — парни и девушки, азиаты и темнокожие.

В чем тут еще загвоздка? Когда мы готовим скульптор лица, то он будет по-разному работать на темной и светлой коже, эти нюансы тоже нужно учесть. Моя задача — подхватить на этом уровне и понять, как мы будем коммуницировать это с аудиторией. Есть очень большой негатив на селфи-редакторы и искажение внешности человека. Мы не хотим проецировать негативный образ, что все ретушируется, и моя задача — аккуратно прокоммуницировать, как мы будем продвигать этот селфи-редактор для разных персон, аудиторий в разной географии. Тренды везде тоже разные — например, в Китае принято отбеливать лицо, и чем белее кожа — тем более ты красивый. Но так коммуницировать на западном рынке мы не можем.

— В чем конечная цель Picsart?

— Благодаря нему можно не сидеть много часов в фотошопе и детально погружаться в возможности программы. Для того, чтобы глубоко изучить его — нужно потратить несколько лет. А здесь сочетание ИИ и других технологий позволяет добиться нужного результата за несколько секунд.

— Вы не видите проблему в том, что ИИ будет генерировать похожие картинки, а ваша аудитория хочет выделяться и быть уникальной?

— Вы правильно заметили, что Gen Z стремится к максимальной индивидуальности и непохожести. И Visual Tech как раз идет к тому, чтобы удовлетворять уникальные запросы. Думаю, скоро мы будем диктовать поисковые запросы и распознавание речи будет транслировать нам визуальные технологии. Даже тренды, которые я смотрела — половина визуала уже смоделировали с помощью компьютерной графики. Через 5 лет 90% графики будет смоделировано. И здесь Visual Tech поможет показать разнообразие контента. И тут как раз и вижу в этом, поможет на разные запросы отвечать и показывать и разнообразие. И вот уникальность контента.

«Благодаря Picsart можно не сидеть много часов в фотошопе и детально погружаться в возможности программы»

— Нет ли проблем с количеством данных, на которых обучается ИИ? Можно ли использовать их в разных регионах мира, учитывая, что везде разное законодательство, регулирующее данные?

— Да, это одна проблема. Плюс девайсы очень разные, ведь пользователи ожидают, что, заходя в приложение, оно должно мгновенно загрузиться. Но чем сложнее технология, тем больше весит софт на телефоне. То есть это уже не десятки, а сотни мегабайт. А 80% пользователей пользуются приложениями, которые не могут загрузить больше 50 мегабайт. Поэтому тут возникает такое неравенство технологий.

Но индустрия идет к тому, чтобы облегчать программы, какие-то вещи переводить в браузер. Мы работаем над тем, чтобы ИИ не был в программе, а все считалось онлайн, если у пользователя есть доступ к интернету.

— Нет ли проблем с данными, на которых вы обучаете алгоритмы?

— Мы и сами сканируем огромное количество данных, чтобы проводить тесты. Плюс закупка баз с визуалом. Здесь важно время — прежде чем запустить все это пользователю, проходит около года, может, даже и больше. Сначала все тестируется, потом переводится на инженерную часть, а потом на тестировку. Нужно много данных и много времени, чтобы отточить процесс. Чтобы технология хорошо сработала с любым лицом и с любой фотографией, если качество будет плохим, — пользователь перестанет пользоваться продуктом.

«Случится бум контента, его будет в 10 раз больше, чем сейчас»

— Как профессиональное сообщество относится к вашему продукту? Они считают вас конкурентом?

— Большинство из них знают или уже пользуются приложением. Если мы говорим про суперпрофессиональное сообщество, которое, например, делает дизайн для NFT и других индустрий, там, конечно, больше относятся к 3D Visual Tech, работают на уровне выше, в программах Adobe или в Autodesk.

Мы очень много работаем с художниками и дизайнерами, мы, наоборот, подсвечиваем их и работаем над совместными проектами. Если они делают крутой арт, — готовим вместе стикеры, загружаем в приложение и рассказываем историю этих художников. Мы делаем такой проект примерно раз в два месяца, в России художником выступил Рома Бантик, Чивискелла, Миша Гудвин. Мы им не конкуренты, а скорее платформа для вдохновения и коллабораций.

— Но обсуждаете ли вы, как их работа и жизнь поменяется из-за ИИ? Не беспокоятся ли они, что их креативная работа поменяется? Воспринимают они нейросети как помощника или конкурента? 

— ИИ действительно не заменяет ум человека, тем более креативного. Художники очень талантливы и могут придумать что-то от себя. Мы отдельно работаем с комьюнити, этим занимается отдел суперюзеров, это люди, которых мы подсвечиваем и держим в закрытом сообществе внутри приложения. Для них есть специальные челленджи, мерч, рассылка и другие программы. Когда мы готовим что-то новое — тестируем и выкатываем только на них и просим обратную связь. Когда есть огромное огромное количество пользователей, нельзя ко всем относиться одинаково — кто-то заходит раз в месяц, а кто-то очень активен. Те, кто активен, — находятся в специальном сообществе экспертов.

«ИИ не заменяет ум человека, тем более креативного»

— Какое дальнейшее развитие Visual Tech?

— То, что изменится в первую очередь — случится бум контента, его будет еще в десять раз больше. Его будут создавать обычные пользователи, а не только те, кто хорошо владеет фотошопом и имеет доступ к хорошему компьютеру. Сейчас у каждого есть такой компьютер в кармане, и он может сделать все, что угодно — от простого мема или стикера до коллажа. Соответственно, нам нужны облачные решения и хард, которые смогут поддерживать такое количество контента.

Изменится юридическая база, сейчас действительно есть проблема с утечкой фотографий — когда чужой контент берется и используется несанкционированно. В ответ появится больше GDPR и других регуляций на уровне стран или, может быть, нескольких континентов, потому что пока границ в мире в этой сфере нет.

Нейросети будут развиваться еще активнее. Будущее за голосовой диктовкой картинок — пользователи будут говорить фразу, и картинка будет появляться на экране. Правда, у этого процесса есть и негативная сторона — это появление дипфейков.

— Что для вас поменялось за последние несколько месяцев? Не упал интерес к вам, ваши загрузки не вытеснились VPN?

— Я три года работала над тем, чтобы наше приложение было в топе App Store и Google Play на русскоязычном рынке. Мы сохраняем свои позиции, с точки зрения скачивания и установок ничего не поменялось, я проверила топ-3, и мы держим рейтинги в категории «Фото и видео». С точки зрения монетизации наш фокус смещен на другие регионы — Европа, Юго-Восточная Азия и Ближний Восток.


Читать далее

Как темная материя «общается» с той, из которой мы состоим. Главное о новом исследовании

Пересадка кала может обратить старение вспять

Сравните, как сняли затмение Луны НАСА и Роскосмос