Эра Data Science: как меняется бизнес с приходом big data и новых технологий

Внедрение новых технологий и работа с big data заставляет бизнес трансформироваться. Речь идет не только о новой должности — Chief Data Officer, но и о постоянном обучении всего персонала от рядовых сотрудников до топ-менеджмента. Новые реалии изменили и правила игры, к которым привыкли в компаниях — работа над проектом в области Data Science не всегда приводит к коммерческой выгоде, но приносит положительные результаты для работы команды и последующих задач. Михаил Сеткин — вице-президент Райффайзенбанка, менеджер продукта отдела управления семействами приложений — рассказал, почему так трудно перестраиваться на «цифровые рельсы», как обучать персонал работе с big data и почему за дата-сайентистами будущее.

 

В России практики внедрения Chief Data Officer нет

Данные являются ключевым активом в эпоху цифровой экономики, наравне с людьми и финансами. Но если за управление людьми отвечает функция HR, за финансы — контроллинг, риск-менеджмент, казначейство и другие подразделения, то данные исторически не контролировал никто. Они как бы общие, но в то же время — ничьи. Сейчас это отношение меняется, в компаниях внедряются практики Data Governance и вводится должность Chief Data Officer.

 


 

Chief Data Officer — одно из высших должностных лиц в компании. Выступает сразу в нескольких ролях: эксперт в передовых технологиях, бизнес-стратег и проводник идей, связанных с использованием данных. Он же отвечает за качество и прозрачность данных, в том числе перед различными регуляторными органами. Chief Data Officer вырабатывает стратегию того, как будет развиваться компетенция организации по анализу данных, какие навыки нужно развивать в сотрудниках. Он же контролирует наличие в организации необходимого набора технологий, позволяющего эффективно добывать, хранить, обрабатывать и визуализировать данные.

 


 

Как показывают практика и исследования, есть три распространенных варианта, где в компании может появиться подразделение Chief Data Officer: отдел прямого подчинения CEO компании, подразделение в подчинении у ИТ-директора или внутри другого бизнес-подразделения — например, финансовой дирекции. Где будет располагаться этот институт, зависит от множества причин: кто первый предложил идею, какие отношения с бизнесом были выстроены, кто в момент внедрения был наиболее к этому готов.

Практика внедрения роли Chief Data Officer приходит с Запада: подавляющее большинство компаний с этой должностью находится в США или Западной Европе. Как правило, это крупные корпорации, которые имеют в своем распоряжении много данных и хотят эффективнее ими управлять, а также финансовые организации, поставленные в жесткие рамки стандартов и положений регулирующих органов, особенно после мирового финансового кризиса 2008 года.

 

 

 

 

На защите европейцев: как GDPR стал дырой в бюджете российских ИТ-компаний

 

 

 

 

Некоторые российские организации, особенно дочерние структуры иностранных компаний или те, чьи акции торгуются на крупных международных площадках, принимают на себя часть этих стандартов и положений. Но к широкому распространению практики внедрения роли CDO в России это пока не приводит.

Вместо строгих офисов — опенспейсы

Организации сейчас сталкиваются с острым дефицитом квалифицированных кадров: мало образовательных программ готовят специалистов по анализу данных. А хорошие специалисты склонны мигрировать в сторону мировых лидеров ИТ-индустрии. Идет борьба буквально за каждый цифровой талант.

Поэтому компании меняют свой подход к найму. Если лет десять назад собеседование аналитика данных начиналось со слов «Расскажите, пожалуйста, почему мы должны взять в нашу компанию именно вас», — то сейчас разговор больше идет о том, почему кандидат должен выбрать именно эту компанию, как он сможет творчески реализоваться в ней, какие интересные данные и прочие способы профессионального развития работодатель ему предложит.

Плюс демократизируются условия внутри компании: все популярнее становится удаленная работа, сотрудники носят джинсы и общаются на «ты». Те строгие офисы, к которым мы привыкли, заменяются на более дружелюбные опенспейсы с гамаками и подушками, где можно позволить себе быть самим собой и не надевать рабочую маску при входе в здание.

 

 

Для тех, кто хочет попробовать себя в Data Science, открываются новые возможности. Раньше для решения вычислительных задач были необходимы большие мейнфреймы, доступные только на предприятиях, — и развиваться самостоятельно было сложно. Сейчас технологии дешевеют, вычислительные мощности возрастают, любому человеку достаточно среднестатистического ноутбука, чтобы погрузиться в предметную область. Мир движется в сторону open source, пакеты для анализа можно скачать бесплатно и легально. Плюс есть образовательные программы от коммерческих и некоммерческих организаций. Любой человек при наличии у него свободного времени, желания и светлой головы может за короткое время обучиться до уровня, когда он сможет претендовать на стартовые должности практически в любой компании.

Образование на всех уровнях

Недостаточно просто утвердить роль CDO и политику Data Governance или укомплектовать штат высококлассными дата-сайентистами. Для эффективной работы над инициативами Data Science необходимо изменить культуру внутри компании.

 

 

Культура бизнесов, которые формировались до широкого распространения Data Science, обычно строится на консервативном подходе к рискам, минимизации издержек, повышении операционной стабильности. Раньше компании старались использовать только проверенные временем бизнес-модели и технологии, а ключевые компетенции нередко отдавались на аутсорс ради экономии. Отчасти это происходило, потому что рынки были сформировавшимися. Например, банки хорошо знали, кто их конкуренты, каково их место в рейтинге, что они будут делать в ближайшие два-три года. И каждый понимал: если он будет делать то же, что другие так же хорошо, как и прежде, — скорее всего, сохранит свой «кусок пирога».

По мере развития цифровых технологий это положение изменилось — стали появляться молодые и энергичные компании, которые отбирают у банков долю рынка, в которой те традиционно считались сильными: платежи, микрозаймы, личные финансы. Чтобы выжить в новых условиях, нужно масштабно изменить мышление и арсенал навыков на всех уровнях организации.

  • На уровне топ-менеджмента — осознать риски, которые влечет бездействие и отказ от новых технологий.
  • На уровне менеджеров среднего звена — развивать общую технологическую грамотность, понимание цифрового продукта: что можно сделать с его помощью, что нельзя, какую роль в этом играет Data Science.
  • На уровне дата-сайентистов — ежедневно отрабатывать навыки, чтобы быть способными быстро решить сложную задачу при необходимости.

 

 

 

 

Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные

 

 

 

 

Осуществить такую масштабную трансформацию невозможно, лишь отправив отдельных сотрудников на курсы переподготовки. Она требует более фундаментального и основательного подхода. Для этого нужно более глубокое вовлечение и поддержка со стороны CHRO (Chief Human Resources Officer — главный сотрудник по кадрам, который контролирует все аспекты политики, практики и операций в области управления людскими ресурсами и производственных отношений для организации —»Хайтек»). Используя все наработки и возможности, которые имеются в HR, он поможет организации создать сбалансированную сквозную программу развития, которая решит все эти задачи.

 


 

Один из примеров решения этой программы — создание «зонтичной» программы развития сотрудников в направлении big data:

  • ежегодный обзорный тренинг для топ-менеджмента, на котором руководители знакомятся с возможностями Data Science и успешными кейсами из мировой практики;
  • базовый тренинг для среднего менеджмента, цель которого — показать выгоду от использования инструментов Data Science и Machine Learning для решения разных типов задач;
  • хакатоны для смешанных команд менеджеров и дата-сайентистов, где они учатся взаимодействовать между собой;
  • регулярные онлайн-соревнования для дата-сайентистов на внешних массивах данных;
  • ежегодный выездной интенсив по решению продвинутого кейса по машинному обучению для дата-сайентистов;
  • индивидуальное обучение менеджеров и дата-сайентистов.

 


 

Терпимость к отрицательному результату

Проект в Data Science внешне похож на разработку программного обеспечения — в обоих случаях целью является получение экономической выгоды или создание для клиентов дополнительной ценности. Чтобы добиться этой цели, пишется код. Поэтому менеджеры часто ожидают от процессов Data Science таких же прямолинейных результатов, как при разработке ПО, и успех измеряется именно тем, удалось ли достигнуть желаемого.

 

 

И все же классическая разработка ПО и Data Science различаются. Одним из наиболее распространенных подходов к анализу данных является CRISP-DM (cross-industry process for data mining), при котором каждая задача представляется в виде некой гипотезы, которая может быть как принята, так и отвергнута. Далее работа над гипотезой проходит через типовые стадии: оценка необходимого массива данных, определение критериев успеха и метрик качества, подготовка данных, моделирование, оценка результата. Чаще всего работа получается циклической, некоторые стадии могут повторяться несколько раз. Если в итоге оказывается, что созданная модель улучшает текущий процесс или продукт компании, она внедряется в эксплуатацию. Но бывает и так, что потраченные усилия не дают положительного результата — например, из-за ограничений на применение модели или низкого качества данных. Такие ситуации не должны рассматриваться как негативный исход, потому что проектная команда получила опыт и знания, которые применит в дальнейшей работе над другими гипотезами.

 


 

CRISP-DM — стандартный процесс для исследования данных. Модель жизненного цикла исследования данных состоит из шести фаз. Последовательность этих фаз строго не определена. Как правило, в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед.

Фазы цикла исследования данных:

  • Понимание бизнес-целей (Business Understanding).
  • Начальное изучение данных (Data Understanding).
  • Подготовка данных (Data Preparation).
  • Моделирование (Modeling).
  • Оценка (Evaluation).
  • Внедрение (Deployment).

 


 

Готовность вступать в игру, исход которой заранее не известен, — это новое требование, не характерное для классического подхода, при котором не достигший бизнес-цели проект принято считать провалом. Плюсы очевидны: культура терпимости к отрицательному результату раскрепощает сотрудников и создает продуктивную атмосферу, что в долгосрочной перспективе все равно приводит к положительным итогам.

 

 

В случае банкинга примером успешной модели может служить предсказание по косвенным признакам и историческим данным доходов клиентов. Банк на основе полученных данных может предложить индивидуальный кредитный продукт без официального подтверждения доходов.

В случае с Райффайзенбанком, нам не удалось добиться результата, когда мы пытались научиться определять оптимальные места для установки наших банкоматов с помощью анализа данных. В условиях задачи было около 2 тыс. банкоматов по всей России, и мы использовали исторические данные по ним, чтобы понять, где банкоматы приносят нам наибольшую прибыль.

Пока собирали данные поняли, что нужно исключить те банкоматы, которые установлены в компаниях-зарплатных клиентах. Но тогда появилась другая проблема — «прибыльный» и «убыточные» банкоматы не были сбалансированы. Для каждого города были свои тенденции прибыльности и убыточности и сравнивать их было некорректно.

Поэтому мы подумали, что наверное наши банкоматы стоят и так в оптимальных местах, а значит показатель практически невозможно улучшить. Гипотеза не оправдала себя. Но благодаря этому опыту оказалось, что надо было сделать инфраструктуру внутри банка по геокодированию. Это обогащение географических объектов координатами на основании текстовых значений адресов. Вообще-то есть на рынке много подобных предложений — через сервисы в публичных облаках, но, во-первых, они достаточно дорогие, во-вторых, данные надо выгружать в стороннее хранилище. Мы же сделали свое решение.

Простейший вывод: если гипотеза не оправдывает себя, все равно можно извлечь из этого пользу.

Границы возможного в Real-time decision-making

Благодаря совершенствованию технологий, широкому распространению интернета и удешевлению систем хранения появилась способность собирать гораздо больше данных о процессах, которые раньше были для людей «черным ящиком». Например, раньше аналитические системы банка строили отчетность каждый день по состоянию на вчера. Имея отчетность за определенный период в прошлом, можно было видеть основные тренды и предвидеть, что произойдет в ближайшем будущем, на что нужно повлиять в первую очередь на макроуровне. Но при этом упускался ряд событий, которые имеют короткий жизненный цикл. Например, имея данные за прошлый месяц, видна динамика развития кредитного портфеля. Но если на рынок выведен новый продукт, необходимо выяснить, как клиенты интересуются новым продуктом именно сейчас, причем по всем возможным каналам: сайт, колл-центр, отделения. Зная, как выглядит ситуация здесь и сейчас, можно более оперативно принимать решения, например, по расходованию маркетингового бюджета.

 

 

 

 

Александр Лямин, Qrator Labs: наша задача — выработать у людей цифровую гигиену, чтобы они «не ели с помойки»

 

 

 

 

Real-time decision-making играет роль не только в принятии решений внутри организации, но также и в том, как общаться с клиентами, понимать их потребности в каждый конкретный момент. Например, клиент находится в торговом центре и совершает покупки. В этот момент ему приходит предложение зайти в магазин из перечня программы «Скидки для вас», где он может получить хорошую скидку по карте. Это предложение актуально клиенту здесь и сейчас, а не завтра, когда он уже уйдет из торгового центра. Также отслеживаются покупки авиа- или железнодорожных билетов.

 


 

Real-time decision-making — предоставление информации в контексте и интеграция с рабочим потоком в режиме реального времени на любое устройство и в любом месте, чтобы решения могли быть приняты в конкретный момент.

 


 

Границы возможного при решении такого рода задач определяются, по сути, несколькими факторами: креативностью сотрудников и создаваемых ими идей, качеством и доступностью данных, необходимых для воплощения идеи в жизнь, и адекватностью технологий, используемых в компании.

 

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости
Российских айтишников обяжут преподавать в вузах: кого это коснется
Новости
Киберспорт в России сегодня: плюсы и минусы разных бизнес-моделей
Мнения
Одинокого дельфина нашли в Балтийском море: он «разговаривает» сам с собой
Наука
Физики обнаружили сразу три формы хаоса
Наука
Российского хакера экстрадировали в США за создание вируса-вымогателя
Новости
Ученые впервые раскрыли форму короны черной дыры
Космос
Названы сроки запуска аналога Apple Pay в России
Новости
В России придумали, как искать телефонных мошенников по голосу
Новости
Лазерную связь в космосе предложили использовать, чтобы фотографировать черные дыры
Космос
Чат-бот Google научили запоминать пользователей
Новости