Может распознавать беспилотники, а может классифицировать водителей
— В Uber нет централизованного отдела данных?
— Есть много разных групп. Uber использует ИИ и машинное обучение во всей компании. Есть финансовые дата-сайентисты, есть — в продукте и много других. Мы — одни из многих, но одни в маркетинге — занимаемся существующими пользователями, маркетинг на новых пользователей.
— Вы говорили про методики подсчета коэффициента оттока водителей. Анализируете не только пользователей, но и водителей?
— Да, в маркетинге мы собираем информацию о водителях, пассажирах, Uber Eats. Они все требуют разных моделей, потому что ведут себя по-разному. У полноценных водителей и у тех, кто иногда использует сервис, разные потребности и разное поведение.
— Как предсказываете отток — кто собирается бросить сервис?
— Основная мысль, которую я пытался донести, — ИИ и машинное обучение, в первую очередь, мощные инструменты классификации. Их можно использовать для распознавания картинок — кошки изображены или собаки, или классифицировать людей, у которых есть рак, или объекты — беспилотные машины. Или их можно использовать для того, чтобы классифицировать людей, которые собираются покинуть платформу. С правильными данными и их правильной обработкой можно построить мощные и полезные модели. Мы пытаемся предсказать, кто прекратит водить для Uber или кто перейдет на Uber Eats. Или, например, кто откроет email. Алгоритмы, по сути, одинаковые — нейросети, деревья решений — все зависит от данных, которые вы «скормите» этим алгоритмам. И как вы разметите эти данные, как проанализируете.
— Uber работает во многих городах и странах мира. Предсказания отличаются от страны к стране или можно построить универсальную модель?
— Существуют общие вещи, но у каждой страны есть и свои особенности. Мы строим модели и в зависимости от регионов, и в зависимости от стран. Так что не можем анализировать людей в Латинской Америке таким же образом, как в Европе или США. Будут поведенческие отличия. Мы полагаемся на местных маркетологов в этих странах, которые нас информируют. Это диалог — кросс-функциональная команда. Они не знают, как использовать алгоритмы и машинное обучение, а мы знаем. Но мы не знаем многие характеристики пользователей в этих странах, которые крайне важны.
— К примеру?
— В Латинской Америке деньги, которые получает водитель, — это в любом случае главный фактор или показатель чего угодно. В США деньги тоже важны, но роль гибкости работы бывает выше. Показатели те же самые, но их порядок, иерархия может меняться. Мы измеряем, сколько часов люди проехали на Uber, как часто они это делают, — и видно, что в США многие воспринимают это как дополнительную работу, частичную занятость, а в Латинской Америке люди относятся к этому как к основной работе.
Чем больше исторических данных, тем лучше пользовательский опыт
— Вы храните все данные обо всех поездках в мире или эта информация как-то сегментируется?
— Хранить вообще все данные сложно по нескольким практическим причинам. Во-первых, это просто объемы, которые нельзя хранить вечно, потому что будут гигантские затраты на хранение. Кроме этого, есть законы о приватности, которые нам надо соблюдать. После года, или, в некоторых случаях, 18 месяцев все данные должны быть анонимизированы и обобщены. Но мы, конечно, хотим хранить как можно больше данных. Потому что чем больше у нас исторических данных, тем точнее модели и лучше пользовательский опыт.
— Что еще можете предсказывать с помощью алгоритмов?
— Есть столько разных моделей, что я уже потерял счет всего, что мы делаем. Мы начали с подсчета коэффициента оттока и ухода пользователей, но под оттоком тоже можно понимать разные вещи. Бывает краткосрочный уход, бывает перманентный. Потому что многие водят для Uber только иногда. Представьте, что я — водитель и прекращаю водить в следующем месяце. Вы мне звоните: как дела, Марио, почему ты перестал водить? А я отвечаю: нет-нет, я просто беру небольшой отпуск, потому что меня навещает семья или я поехал отдыхать. Что-то в этом роде. Так что мы учим наши модели распознавать и такие случаи.
Есть разные модели отписки, разные модели Open Rates, кросс-продаж. Если я пользуюсь Uber, какова вероятность того, что я начну пользоваться Uber Black, премиальным сервисом? Или какова вероятность того, что я буду заказывать еду с Uber? И если я заказываю еду, какова вероятность того, что я закажу именно в этом ресторане? С помощью этого мы можем предсказывать спрос для разных ресторанов и предупреждать их об этом. Предсказания, классификация, пользовательский опыт — мы занимаемся всеми этими сферами.
— Если предсказываете, что пользователь скоро может вас покинуть, как пытаетесь сохранить его?
— Здесь включается маркетинг. Мы — дата-сайентисты, и не знаем, какое сообщение или промо сработает. Мы близко работаем с маркетингом, но наша роль — идентификация, а роль маркетинга — работа с этими идентифицированными пользователями. Конечно, обмениваемся мыслями, у нас бывают свои идеи, но обычно это зона маркетинга.
— Как привлекаете новых пользователей с помощью данных?
— У нас есть реферальная программа — мы платим вам, если вы приводите своих друзей. Особенно для водителей, если они приводят новых водителей. Так что нам приходится подсчитывать правильный размер бонусов, которые получат пользователи. Какова вероятность, что при такой сумме денег вы приведете новых людей, которые останутся в сервисе? Мы тестируем много таких моделей, но предсказывать сложно, так как когда вы приводите друга, мы почти ничего о нем не знаем. Мы все равно делаем предсказания, но они очень грубые. Но с течением времени мы узнаем людей лучше и обрастаем данными — предсказания становятся точнее. В течение «жизненного цикла» пользователя используются разные модели.
Даже скорая помощь может стать частью Uber
— Давайте поговорим о будущем индустрии — Uber сейчас начинает байкшеринг и скутершеринг. Как, по вашему мнению, это будет развиваться?
— Я не могу говорить от лица всей компании, но миссия такова: мы платформа для перемещений. Так что если у вас есть лошади и вы хотите возить людей на лошадях в Сибири, потенциально могли бы быть на платформе. Если у вас скутеры, тоже могли бы. Я сейчас это все придумываю, но идея заключается в том, что это платформенная компания, люди могут приносить в нее новое. Например, скорая помощь. Большая проблема с ней заключается в том, что нужно звонить, нужно ждать, оператор постоянно должен связываться с водителем. Это все можно было бы автоматизировать. Скорее всего, это будущее, потому что все эти виды перемещения могли бы оказаться на нашей платформе.
Другой тренд, который я вижу, и это личное мнение, — все больше компаний узнают, как и для чего мы используем сложные модели обработки данных, и начинают этим заниматься. Так что нам придется придумать что-то новое, что будет эффективным.
— Потому что предсказания теряют свою эффективность, если предсказывать это умеют все?
— Именно так. У всего есть жизненный цикл. Нельзя вечно использовать одно и то же, это перестает быть магией.
— Что думаете о жизненном цикле больших данных и машинного обучения?
— Давайте я расскажу о том, что лично видел за последние 25 лет. Когда я начал работать аналитиком в этой сфере, на самом деле, в маркетинге, в основном все шло через телевидение. Потом мы начали собирать данные, маркетинг начал их использовать. Началось сегментирование, появилась целая индустрия BI, где были интерактивный анализ и визуализация этих данных. Но можно было манипулировать только несколькими переменными. Современные модели работают с 80, 100 и даже 200 переменными. Человек никогда не сможет сам это сделать. Это должно быть автоматизировано. Мы растем, и машинное обучение, и ИИ развиваются очень быстро. Модели, которые мы разрабатываем сейчас, — это база для более сложного анализа в будущем.
BI, Business Intelligence — совокупность компьютерных методов и инструментов для организаций, обеспечивающих перевод транзакционной деловой информации в форму, воспринимаемую человеком и пригодную для бизнес-анализа, а также средства для массовой работы с такой обработанной информацией.
Цель BI — интерпретировать большое количество данных, заостряя внимание лишь на ключевых факторах эффективности, моделируя исход различных вариантов действий, отслеживая результаты принятия решений.
— Как вы думаете, может ли в индустрии появиться новый инструментарий?
— Сложно сказать. Если бы вы спросили меня пять-шесть лет назад, я бы сказал, что не знаю. Потому что тогда мы только развивали BI, а потом появился ИИ и доказал свою пользу. Кто знает, что сейчас еще разрабатывают. Но эволюция BI заняла почти 20 лет, так что все это может занять, по крайней мере, 10–15 лет. Пока не придет что-то новое.
— Как повлияет на рынок внедрение ИИ?
— Конкуренция увеличится, потому что все маркетологи начнут использовать одни и те же инструменты. У нас очень хороший таргетинг, но когда Lyft или Яндекс начинают делать то же самое на таком же уровне, конкуренция растет.
Потом появятся лошади и верблюды
— В России Uber объединился с Яндексом. В некоторых других странах Uber также работает в рамках совместных предприятий. В таких случаях используете те же алгоритмы и делитесь ими с компанией-партнером?
— Нет, мы вообще не работали с Яндексом. Я не знаю — возможно сотрудники Uber EMEA (Europe, Middle East and Africa — аббревиатура рынка, включающего в себя Европу, в том числе Россию, Ближний Восток и Африку — «Хайтек») с ними работали, но я так не думаю.
— Эти совместные предприятия отделены от обычного сервиса?
— Я думаю, да, они не делятся данными и практиками.
— Есть ли у вас какие-то данные из России?
— Нет, у меня нет доступа ни к каким данным.
— А были раньше, когда Uber был независимым?
— Когда Uber был в России, технически я мог получить эти данные, но сейчас нет. Я даже не знаю, собираются они или нет.
— Какие страны сейчас самые перспективные для Uber?
— Латиноамериканский рынок очень быстро растет — есть Сан-Паулу, Мехико, Богота. Они все крайне быстро растут, это огромные города. Мехико и Сан-Паулу больше Москвы (согласно отчету Demographia World Urban Areas 14th Annual Edition население городских агломераций Мехико (20,6 млн человек) и Сан-Паулу (21,1 млн человек) действительно больше агломерации Москвы — «Хайтек»). Рио-де-Жанейро немного меньше, но все равно это огромный город. США — также сильный рынок для нас. Но у нас есть и новые сервисы — Uber Eats растет очень быстро. Сейчас появляются велосипеды и скутеры. А потом, кто знает, может, будут лошади и верблюды. В любом случае платформа становится только лучше.