Анализ больших данных заложен в генах у платформы Coursera — компания была основана в 2012 году двумя экспертами в этой области, профессорами Стэнфордского университета Эндрю Ыном и Дафной Коллер. За время своего существования платформа накопила огромную экспертизу в области онлайн-обучения. «Хайтек» встретился с главным специалистом по анализу данных Coursera Винодом Бактавачаламом и узнал у него, как машинное обучение изменит мир образования в ближайшем будущем и почему в России мотивация к обучению и продвижению по карьерной лестнице выше, чем в США и Европе.
Coursera — международная платформа онлайн-образования, на которой зарегистрировано более 37 млн пользователей. Она предлагает около 2 900 курсов, 300 специализаций, есть отдельные курсы и специализации, самая высокая ступень — получение степени degrees (получение высшего образования по европейским стандартам). Образовательный контент для курсов создают 160 университетов и других образовательных учреждений, а также 30 индустриальных партнеров.
«Россияне больше других сфокусированы на применении изученного в работе»
— Вы недавно впервые провели исследование, посвященное навыкам российских учащихся. Какая специфика у российских онлайн-студентов?
— У нас более 940 тыс. зарегистрированных пользователей из России, это второй по размерам рынок в Европе после Великобритании и самый большой не англоговорящий рынок. Он очень быстро растет — по 40% каждый год. Вовлеченность тоже очень высокая — пользователи из России подписались на 3,5 млн курсов, то есть около четырех курсов на человека, столько же, сколько в США или в Великобритании.
— А что касается пола и возраста?
— Средний возраст примерно такой же, как и на глобальном уровне. Но российские пользователи более сбалансированы в гендерном плане — 47% женщин, 53% мужчин, в мире 42% против 58%. Это в целом соответствует тому, что мы видим в США и Англии, и говорит о том, что в России все заинтересованы в высококачественном образовании и очень замотивированы на учебу. Больше всего россиян интересуют анализ данных, бизнес и компьютерные науки. Они хотят строить карьеру — около 67% озвучивают такую цель. Они стремятся развиваться в текущей должности либо получить повышение, переключиться на что-то новое и приобрести новые навыки. Это выше общего уровня в 60%, то есть россияне больше других сфокусированы на применении изученного в работе.
— И они достигают этих целей?
— Да, мы отслеживаем долгосрочные результаты обучения всех пользователей на нашей платформе в течение полугода после того, как человек окончил курс. Спрашиваем, достигнута ли цель. В 85% случаев пользователи из России, указавшие карьеру, рапортуют о достижении этой цели, 35% получили при этом повышение, нашли новую работу или открыли собственный бизнес. Это очень сильная корреляция между поставленной и достигнутой целью.
Сбербанк и Яндекс ищут работников с помощью контента
— Мне кажется, российские компании не воспринимают онлайн-сертификаты всерьез.
— Зависит от компании. Да, мы и в США это видим: здесь тоже большой разрыв между прогрессивными компаниями и всеми остальными. В России компании-лидеры в сфере технологий — Сбербанк (Корпоративный университет) и Яндекс — создают контент на Coursera, инвестируют в онлайн-тренинги для своих сотрудников, ищут новых работников среди тех, кто проходил курсы, получал сертификаты. Вот такие инновационные компании не видят разницы между онлайн- и офлайн-образованием, им просто нужны люди с требуемыми навыками, с высокой мотивацией к освоению нового, так как технологии постоянно меняются.
Такое могут позволить только крупные компании, потому что у них есть ресурсы, они могут уделять больше времени образованию сотрудника. Небольшие компании пока считают онлайн-обучение рискованным, им гораздо проще нанять людей с дипломом университета, потому что понятнее, как отобрать кандидатов высокого уровня. Но все больше компаний осознает, что нанять людей с конкретными навыками непросто, а онлайн-образование — дешевый способ переобучить уже имеющихся сотрудников.
— И какие компании используют эту возможность?
— У Google есть сертификат базового уровня для всех ИТ-должностей — компьютерные техники, сетевые специалисты и прочие. Они не только создали контент, но и строят партнерства по найму, чтобы люди с таким сертификатом могли подать заявку на работу в Google, Walmart и другие компании.
— Вы делаете какую-то кастомизацию пользовательского опыта в зависимости от страны?
— Разница между странами невелика, гораздо сильнее пользователи различаются на индивидуальном уровне — у них разный набор навыков, разный жизненный опыт, разные цели. И мы как раз занимаемся персонализацией пользовательского опыта на индивидуальном уровне, применяя машинное обучение. Зато в плане построения партнерских отношений российский рынок сильно отличается от американского.
— И в чем разница между вашими бизнес-партнерами в России и в США?
— С моей точки зрения, российские университеты и отраслевые партнеры гораздо больше настроены на совместную работу, они более инновационные, больше хотят пробовать новое. Мы сотрудничаем с ВШЭ, МФТИ, Яндексом, Сбербанком. Они создают совместно как академический контент, так и практические отраслевые курсы. ВШЭ и Яндекс, к примеру, сделали теоретическую образовательную программу высокого уровня по машинному обучению, и в рамках программы курс о том, как выиграть соревнование по машинному обучению: приемы и хитрости от победителей таких соревнований, то есть прямой опыт в обработке специалистов по теоретическому знанию. Это уникальная ситуация, свойственная только России, в других странах у нас нет примеров такого партнерства. Российские компании расширяют горизонты и в вопросах найма по ключевым навыкам — те же Сбербанк и Яндекс ищут себе людей с помощью контента.
В онлайн-обучение придет общение с однокурсниками
— А внутри курса как вы используете машинное обучение для сохранения мотивации учеников?
— Есть две ситуации, где мы используем персонализацию. Первое — поиск новых курсов, они должны быть максимально релевантны пользователю. Тут приходят на помощь большие данные. Мы создаем серию алгоритмов для соединения навыков с контентом, помогающим их приобрести, с карьерными возможностями, для которых требуются такие навыки, и с пользователями с этими навыками. Благодаря анализу человек находит максимально подходящие ему курсы.
Второй момент — поддержка внутри курса, когда пользователь столкнулся с трудным материалом. Тут включается «умный наставник», который отправляет кастомизированные сообщения. Например, когда вы провалили зачет и потеряли мотивацию, мы пишем: «Не волнуйся, 70% людей не прошли это задание с первой попытки, вот ссылки на материалы, которые помогли другим пользователям в этой ситуации». В начале курса мы можем написать: «68% закончивших этот курс, получили повышение или новую работу». Мы каждую неделю слегка подталкиваем пользователя, и благодаря этому этому он заканчивает курс. Постепенно можем выяснить, какие виды сообщений работают хорошо именно для вас, и использовать их дальше.
— Мне почему-то предложили курсы по машинному обучению, хотя меня интересует психология, и я до этого несколько лет назад уже подписывалась на курс по психологии.
— Да, это проблема. У нас около 3 тыс. курсов на самые разные темы. Десятки миллионов пользователей. Если все это перемножить, получаются миллиарды вариантов рекомендаций. Персонализация очень сложна. Мы начали с того, что рекомендовали выбранное другими людьми, которые присоединились к тому же курсу. Работало успешно, но не с новыми пользователями, а любой человек, давно ничего не делавший на платформе, — для системы новый. Мы используем данные за последние полгода, потому что предпочтения людей со временем сильно меняются. Так что решили просто спрашивать людей напрямую: какие у вас цели? Потом узнаем о вашем опыте в этой отрасли, и, наконец, даем рекомендацию.
Лучшие курсы Coursera по анализу больших данных по версии Винода Бактавачалама
Построение бизнес-стратегии в компании на основе анализа больших данных:
- Эконометрика (Econometrics).
- A Crash Course in Causality: Inferring Causal Effects from Observational Data
- Econometrics
- Causal Inference
Обучение теории машинного обучения для создания продуктов на ее основе:
- Machine Learning
- Advanced Machine Learning Specialization
- Deep Learning Specialization
- Machine Learning Specialization
— Какие основные тренды в онлайн-образовании вы видите?
— Первый — уровень персонализации будет расти. У нас собрано множество данных о пользователях: что они учат и как, в какое время дня, слушают ли они десять часов подряд или по 15 минут каждый день. Онлайн-опыт сейчас очень похож на обучение в классе. Это просто набор видео: вы сидите и смотрите их, одно за другим. В будущем навигация по курсу будет более свободной: сначала вы пройдете тест, чтобы мы поняли, в какую часть курса вас отправить, потом, если что-то слишком сложно, вас вернут на шаг назад, затем предложат тест на знание материала. Если это будет слишком просто, часть образовательной программы можно будет пропустить.
Второй тренд — дешевое масштабирование технологий. Преимущество обучения в аудитории во взаимодействии с однокурсниками. Если мы перенесем это в онлайн-обучение, все сильно изменится. Мы еще не умеем синхронно соединять миллионы людей. Пока что это работает на очень небольшом количестве людей — через форумы, веб-конференции, интегрированные в курсы.
— Что насчет дополненной и виртуальной реальности?
— Эти технологии очень актуальны для промышленного обучения. Но я могу представить, как мы будем виртуально взаимодействовать с коллегами над решением бизнес-задач. Если получится очень точно воспроизводить рабочее окружение для обучения практическим навыкам, то мы сможем составить конкуренцию университетам. Это вопрос далекого будущего. Мы часто обсуждаем на конференциях, что онлайн-обучение не может дать навыки коммуникации: как работать в команде или организовывать рабочее время. Вот как раз для таких навыков подходит VR — например, для симуляции опыта взаимодействия с потребителями.
Первый год колледжа провести в онлайне
— Что уйдет в онлайн в ближайшее время?
— Технические направления — анализ данных, в первую очередь. На него столько запросов, что университеты просто не могут их удовлетворить. Онлайн же можно получить фидбэк, изучать кейсы и много других плюсов.
— А что касается более традиционных специальностей?
— В других областях тоже есть потенциал. Возможно, не в ближайшее время, потому что университеты очень заинтересованы в сохранении офлайн-образования. Но можно спокойно переводить первый год обучения в любом колледже онлайн — все эти введения в биологию, химию. Некоторые учреждения уже это делают. Так образование будет разбиваться на части. После изучения теории онлайн студенты в аудиториях будут погружаться в специальность. Кроме того, это способ снизить стоимость образования, которая постоянно растет.
— Какие еще минусы у онлайн-образования?
— Многие говорят, что в университете больше учились друг у друга, работая в группах, чем на лекциях. Если мы сможем перенести это в онлайн, получится мощный инструмент. Второй минус — отсутствие нетворкинга. В университете вы общаетесь с людьми со схожими взглядами, они, в свою очередь, знают кого-то, кто поможет вам получить работу. Онлайн, конечно, можно найти компанию, которая захочет нанять вас за ваши навыки. Но большинство компаний хотят людей с рекомендациями.
История для взрослых
— Над чем сейчас работаете? Какие крупные изменения ждут Coursera в ближайшем будущем?
— Мы работаем над сравнительным анализом навыков. С помощью этой опции можно очень эффективно оценивать уровень подготовки, выстраивать личный профиль пользователя и предлагать кандидатов компаниям, которые уже есть на платформе. Например, какой-то компании нужен диджитал-маркетолог. Мы отправляем ей профиль идеального цифрового маркетолога. А тому, кто хочет стать цифровым маркетологом, предлагаем диагностику навыков, сравниваем его профиль с идеальным вариантом, отмечаем сильные и слабые стороны и предлагаем подходящие курсы и порядок, в котором их надо пройти. Как только человек достигает нужного уровня, мы отправляем сообщение: теперь вы достаточно квалифицированы, чтобы работать в таких-то компаниях, и вы даже лучше, чем некоторые сотрудники этих компаний, которые тоже пользуются Coursera.
— Вы планируете делать курсы для детей и подростков?
— Наша специализация — взрослые. 50% рабочих мест в мире под угрозой автоматизации, поэтому есть большая нужда в переобучения людей, находящихся в середине и на поздних стадиях карьеры. У нас уже выстроена экосистема, и это наша экспертиза.
— У вас есть интересное исследование о влиянии старения населения на экономический рост. Поделитесь его результатами?
— Да, в экономической литературе есть две гипотезы. Сначала кажется: из-за старения рост замедляется, ведь людей рабочего возраста становится меньше. Но есть другие исследования, которые говорят: раз меньше рабочей силы, то компаниям сложнее найти работников, и они должны адаптироваться, замещать людей технологиями, благодаря этому экономика не замедляется. Я попытался проанализировать эти две гипотезы и пришел к выводу, что компании недостаточно эффективно изучают демографические тренды, не инвестируют в далекое, по их мнению, будущее. Некоторые адаптируются, но как? Замещают рабочую силу или просто используют технологии, чтобы сделать сотрудников более эффективными? Есть и то, и другое. Компьютеры автоматизируют линию сборки, сборщики теряют работу, но есть необходимость в техниках, которые будут создавать роботов и обслуживать их. Просто нужен новый набор навыков.
— А какие самые странные курсы есть на Coursera?
— У нас есть все. Например, курс о фейковых новостях: почему их так много, как отличить лженовости от хороших новостей.
— А самые популярные?
— Все, что касаются бизнеса, компьютерных наук и анализа данных. Сейчас самые популярные курсы — о машинном обучении, искусственном интеллекте и особенно о глубоком обучении. Пользуются спросом конкретные инструменты для анализа данных: облачные технологии, платформы предлагают курсы, как пользоваться их инфраструктурой. Компании часто обучают своих сотрудников с помощью таких курсов. Также популярны курсы по технологиям с открытым кодом, например, TensorFlow от Google. Популярны курсы по биткойну.
— По-прежнему?
— Да, забавно, есть прямая корреляция между курсом биткойна и интересом к курсам о биткойне. А вообще блокчейн — все еще очень хайповый тренд. Многие компании хотят нанять блокчейн-девелоперов, но университеты пока этому не учат. У нас есть партнеры из отрасли, которые создали очень успешные продукты для обучения.
— А как у вас выстроены вопросы этики?
— Мы хотим построить платформу, на которой университеты, изучающие вопросы этики, совместно с компаниями, которые зарабатывают деньги с помощью технологий, будут работать над этими вопросами — что делать с искусственным интеллектом и прочим. Вообще мы постоянно обсуждаем вопросы этики в компании. Например, изначально у нас было разделение по полу в рекомендациях, и да (какой сюрприз!) — женщины реже выбирают инженерные специальности. Но мы не хотим увековечивать все те же стереотипы, что и офлайн-образование, поэтому отключили эту опцию. Моральный компас очень важен.