Мнения 25 мая 2019

Анна Серебряникова, «МегаФон» — об открытости данных, создании законодательства в больших данных и условиях для прорыва России

Далее

Большие данные, несмотря на то, что их применение в большой науке и разнообразных сферах жизни человека — от медицины до банкинга — неоспоримо, по-прежнему остаются «черным ящиком», прежде всего, с правовой точки зрения. Законодателям не понятно, как классифицировать и определять само понятие больших данных. В свою очередь, игроки этого рынка опасаются ограничений, которые лишь усложнят развитие цифровой экономики, и ратуют за диалог с государством, подталкивая его к открытию данных, полезных для развития науки, технологий искусственного интеллекта и бизнеса. «Хайтек» поговорил на конференции ЦИПР-2019 с президентом Ассоциации участников рынка больших данных Анной Серебряниковой о том, почему большим данным не нужна законодательная база, насколько важно объяснять людям сложные технологии и почему государству так трудно делиться своими данными с бизнесом.


Анна Серебряникова — президент Ассоциации участников рынка больших данных, член совета директоров компании «МегаФон», руководитель рабочей группы «Информационная инфраструктура» АНО «Цифровая экономика» и член Координационного совета по цифровизации в Российском союзе промышленников и предпринимателей.

Закончила юридический факультет МГУ. Получила степень магистра права с отличием в университете Манчестера. В 2006 году пришла в компанию «МегаФон», где спустя год была назначена корпоративным секретарем, а уже в 2008 году — директором по правовым вопросам. С 2012 года возглавляла блок по связям с законодательной и исполнительной властью. В 2016–2018 годах Анна Серебряникова — операционный директор МегаФона. Также входила в Совет директоров Mail.Ru Group.


Насущная проблема — как пустить данные в оборот

— Чего можно ожидать от законодательства, которое скоро может появиться на рынке больших данных?

— Мы в Ассоциации участников рынка рассчитываем, что законодательство про большие данные появляться не будет. Оно не нужно. Более того, нигде в мире не существует легального определения больших данных. И это не случайность, потому что большие данные — это развивающаяся технологическая сущность, которую в правовом поле нет смысла определять.

— Потому что никто не может сказать, где начинаются большие данные?

— Да, никто не может сказать, тысяча записей — это уже большие данные или нет. Две минуты обработки машины — это много или мало. В этом нет юридической цели, потому что большие данные сами по себе служат определенным целям. И то, что законодатель хочет делать — так это защищать интересы граждан и общества. И регулировать деятельность бизнеса. Вот для того, чтобы защищать граждан, нужно разобраться с более четким или прикладным определением законодательства о персональных данных. Законодательства о тайнах. Где граница персональных данных, как происходит их обезличивание, что можно делать с обезличенными данными, которые не подлежат восстановлению и так далее. То есть как данные пустить в оборот, чтобы они стали доступны для обработки нейронными сетями, например. Это уже сейчас насущная проблема. Второе, что нужно сделать — из запретительного характера регулирования данных перейти к собственно разрешительному, когда человек сам управляет своими данными. Хочет, чтобы его данные использовались для научных целей в медицине, — он их отдает. Не хочет — не отдает.

Этические вопросы и закрытость государства, как обладателя больших данных

— Вы сказали про этические вопросы — в Ассоциации (прим. Ассоциации больших данных) сейчас есть этический комитет? Как и кто формулирует эту этику сейчас?

— Мы разрабатываем этический кодекс, который планируем до конца лета представить уже как официальный документ. К нему присоединяются все участники Ассоциации больших данных, он открыт для присоединения любых других участников рынка. Там формулируются те принципы, на которых мы работаем с данными. Что можем делать, что не можем, какая ответственность за это наступает.

— Это этический документ, который составляют представители бизнеса. Будет ли открытое обсуждение, привлечение экспертов из каких-то других областей?

— Мы рассчитываем на открытое обсуждение — впервые проведем его в рамках экономического форума. И дальше на других площадках. Мы делаем это совместно: наша Ассоциация, Институт развития интернета, Аналитический центр при Правительстве, Медиакоммуникационный союз — вовлечен довольно широкий круг экспертов.

— Насколько государство вообще должно влезать в рынок больших данных и насколько эффективно оно это делает сейчас?

— Государство — большой игрок на поле данных. Безусловно, не все данные оно может открывать или разрешать их вторичное использование. Но есть виды информации, которые интересны бизнесу, их имело бы смысл открывать. Хотя бы для научных целей на старте. Если мы говорим и про большие данные, и про ИИ, то обучение нейронных сетей нужно делать на данных. И, возможно, для того, чтобы Россия сделала рывок в этом направлении, нужно, как раз, создавать научные сообщества, которые будут тестировать различные модели, алгоритмы и дальше уже делиться ими с бизнесом. Мы такой диалог с государством ведем, потому что не вести его невозможно. Понятно, что государству такие решения принять сложно. Но я лично верю, что использование данных государственных информационных систем возможно, и к этому нужно прийти в ближайшее время.

— И цель в том, чтобы государство открывало эти данные?

— Да, в каких-то форматах открывало данные. Это могут быть и специальные условия использования, и ограничения, но, тем не менее, сохранять полную закрытость, наверное, с точки зрения цифровой экономики, неправильно.

— Это логично, если мы говорим про данные, которые начинают собирать сейчас, и пользователей предупреждают.

— Пользователей всегда предупреждали — не было такого времени, когда кто-то собирал данные, не предупреждал и не брал согласия.

— Ну были пользовательские соглашения, которые никто никогда не читал…

— Их продолжают никогда не читать, ничего не поменялось.

— Да, но вы не считаете, что сейчас бизнесу нужно более понятным языком объяснять пользователям, что происходит с их данными? Какие данные собирают?

— Ну это же вопрос с подвохом — конечно, нужно объяснять, если граждане хотят это услышать. Вот я хочу вас научить сейчас, например, делать ультразвуковое исследование. Но, если вы не хотите научиться, то никогда не научитесь. То же самое и с данными — если вы хотите разобраться в этом, конечно, должны быть инструменты, разъясняющие, что с данными происходит. А если не хотите, то я вас не заставлю об этом узнать.

Бизнес не хочет украсть у гражданина личность

— Ассоциация участников рынков больших данных — это все-таки представители бизнеса. И бизнесу, естественно, хочется меньше ограничений и регулирования.

— Нет, на самом деле, в Ассоциации заинтересованы в пользовательской осознанности. Потому что наши клиенты — это вы. Хотим, чтобы нас выбирали, и мы не раздражали. Поэтому очень важен консенсус между гражданами и производителями каких-то продуктов. Не нужно думать о том, что бизнес хочет что-то нарушить, украсть у гражданина его личность и неизвестно для чего использовать. Нет, это заблуждение. Наоборот, хотим, чтобы вам нравилось, как мы делаем персональные предложения, используя ваши данные.

— Вы сейчас говорите про использование данных внутри компании. Если бизнес собирает данные, на их основе делает вам персональные предложения. А если какая-то компания эти данные продает дальнейшим контрагентам?

— Например, данные сотовых операторов продаются ДИТу Москвы для того, чтобы он лучше дороги спланировал. Там нет ваших фамилий, имен и отчеств. Есть количество данных о перемещениях из точки А в точку Б в определенное время суток. Хорошо это или плохо? Я считаю, что хорошо. Это помогает лучше спланировать дороги. Должна ли я вас спросить о том, что данные о вашем перемещении погрузятся в анонимизированную базу, и будут таким образом предоставлены — думаю, что, наверное, нет.

— Насколько и в каких формах можно ожидать какой-то кооперации крупнейших стейкхолдеров на рынке данных — телекома, банков и так далее?

— Для каждого участника рынка и крупных владельцев баз данных защита своего периметра — это конкурентное преимущество. Поэтому нет рынка торговли сырыми данными. Ни Сбербанк, ни МегаФон, ни Ростелеком — никто свои данные не продает и никогда не продаст. Потому что это конкурентное преимущество. Но обогащение данных — это интересное направление, потому что из него можно извлечь новые экономические смыслы, которые раньше нам были недоступны. Но при этом обогащение должно быть без передачи. И одна из целей Ассоциации — на технологическом уровне разработать алгоритмы, когда обогащение данных возможно, но при этом персональные данные или базы данных не передаются.

Фото: ЦИПР

— На форуме много говорили про сквозные технологии, там девять направлений — большие данные, искусственный интеллект, квантовые вычисления и так далее. Насколько это вообще правильное и нужное разделение?

— Я думаю, что разделение не является ключевым — все эти направления важны для развития цифровой экономики, и чем больше мы об этом рассказываем, тем меньше у людей заблуждений в отношении того, что роботы заменят человека или отнимут у него рабочие места. Нет, такого не произойдет в ближайшей перспективе — и не происходит. Наоборот, разговор об этих сквозных технологиях дает возможность создать общественный консенсус по этому поводу. Хорошо, когда второе мнение по поводу исследований формируется на базе нейронных сетей и является подсказкой для врача? Наверное, хорошо. Нарушает ли это ваши права? Нет, не нарушает. И такого рода применения становится все больше и больше.

Врезка

Где брать данные — хороший вопрос. Одной из целей Ассоциации является создание так называемой песочницы, где будут собирать исторические данные — не только свои, но и другие отраслевые. Например, открытые данные о погоде или загрузке транспортных коридоров. И мы даже точно не знаем, для каких целей стартапы могут использовать их. В песочницу попадут и исторические данные некоторых участников, потому что онлайн-данные мы пока не готовы отдавать — непонятна регуляторная составляющая и это довольно рисковая зона. Но исторические данные, деперсонализированные, мы туда отдадим, обогатим их информацией из открытых источников, и получится такая среда для того, чтобы стартапы могли использовать или тестировать свои алгоритмы на тех данных.

— Они их смогут оттуда выкупать?

— Нет, скорее всего, это будет система допуска, присоединение к общим правилам этического характера Ассоциации. Потому что мы хотим, чтобы в противоправных целях наша база не использовалась, поэтому будем контролировать. Это будет песочница именно для тестирования. Если кто-то из участников Ассоциации заинтересуется стартапом, то это уже конкретные вопросы о сотрудничестве.