В 2018 у ИИ и роботов были как победы, так и поражения. Машины лучше человека сдали экзамен на понимание текста, значительно улучшили свою краткосрочную память и научились более ловко прыгать через препятствия. В то же время у ИИ нашлись и новые ограничения: оказалось, что алгоритмы не слишком хорошо работают в команде, уступая в этом умении людям. ИИ активно обсуждали на крупнейших глобальных экономических форумах, а проблемы этики в области машинного обучения стали настолько значимыми, что ряд крупных компаний и международных организаций создал комитеты по этим вопросам. Заместитель директора по исследованиям и разработкам компании ABBYY Татьяна Даниэлян собрала 12 самых важных событий 2018 года в мире ИИ, которые повлияют на людей и бизнес в ближайшем будущем.
Не только человечество усердно трудилось весь год, разрабатывая и внедряя новые технологии, совершая научные прорывы и осваивая космос. У ИИ тоже выдался насыщенный год. Несмотря на скепсис многих экспертов, предсказывающих совсем скорое наступление «зимы» для технологии ИИ, дата-сайентистам удается преодолевать технологические тупики. Из неудач — команда ботов OpenAI впервые проиграла людям в чемпионате по Dota 2. В остальном 2018-й стал годом под знаком ИИ, машинного обучения и успехов в роботехнике.
Уже сдал экзамен лучше человека
15 января. Нейросеть сдала Стэнфордский тест на чтение и понимание текста лучше человека. Тест считается одним из наиболее точных инструментов для измерения способностей интеллекта. В этом году ИИ прошел опросник с результатом 82,6%, лучший результат человека — 82,3%. Чем лучше ИИ понимает человека, тем проще бизнесу применять его для различных задач, в том числе — связанных с обслуживанием клиентов. ИИ сможет полноценно принимать и правильно адресовать специалистам вопросы от пользователей, регистрировать людей на рейс, автоматически открывать счет в банке, делать заказы в интернет-магазине и выполнять другие поручения. Развитие технологий обработки естественного языка особенно значимо для юристов, анализирующих большой объем договоров и контрактов на предмет нарушений, риск-менеджеров, которые оценивают последствия решений для компании, а также для создания более интеллектуальных виртуальных ассистентов.
Стэнфордский тест на чтение и понимание текста, Stanford Question Answering Dataset (SQuAD) — набор данных для понимания прочитанного, состоящий из вопросов, основанных более чем на 500 статьях «Википедии». Ответ на каждый вопрос представляет собой фрагмент текста, зачитанный отрывок или вообще может отсутствовать. Например, в тесте содержится текст об истории британского сериала «Доктор Кто» и вопросы о том, как назывался космический корабль главного героя.
Всего в датасете 100 тыс. вопросов. SQuAD считается самым сложным в области когнитивной обработки текстов. Он привлекает разработчиков из университетов и компаний — таких как Google, Facebook, IBM, Microsoft в Университете Карнеги-Меллона, Стэнфордском университете и Алленском научно-исследовательском институте.
23 января. ИИ стал главной темой Всемирного экономического форума в Давосе 2018 года — глобальной трибуны для обсуждения экономических и общественных вопросов. Представитель Accenture озвучил оценку: при условии, что бизнес будет активно инвестировать во взаимодействие машин и людей, в 2022 году доходы компаний от ИИ вырастут на 38%. Глава IBM Джинни Рометти рассказала о концепции «объясняемого ИИ», когда технологии не только решают задачи компаний, но и аргументируют свои действия. Это уменьшает недоверие людей к новым технологиям и допускает их применение в более сложных процессах. Генеральный директор Salesforce Марк Бениофф сообщил: совет директоров корпорации использует ИИ, чтобы принимать стратегические решения. ВЭФ еще раз продемонстрировал, что компании-разработчики и производители вычислительных мощностей становятся влиятельными игроками на международной арене.
Salesforce.com — американская компания, разработчик одноименной CRM-системы, предоставляемой заказчикам исключительно по модели SaaS. Под наименованием Force.com компания предоставляет PaaS-платформу для самостоятельной разработки приложений, а под брендом Database.com — облачную систему управления базами данных.
4 марта. Стартап UiPath — разработчик решений для роботизации бизнес-процессов (Robotic Process Automation, RPA — «Хайтек») привлек $120 млн инвестиций. Капитализация компании превысила $1 млрд. Программные роботы, или, как их называют, цифровые работники — один из главных технологических трендов 2018 года. Deloitte прогнозирует: в ближайшие два года количество проектов в области роботизации увеличится на 70%. Такой спрос объясняется тем, что RPA можно внедрить за несколько месяцев, окупаются они за полгода и не требуют глубокой интеграции. Роботы экономят миллионы часов рабочего времени: наполняют клиентскую базу, обрабатывают несложные финансовые транзакции или отвечают на простые запросы в техническую поддержку. Например, «Альфа-банк» доверил роботам обработку платежей, разбор внутренней почты, изменение данных клиента и правки кредитных договоров по заявлениям. Компания планирует экономить на этих процессах по 85 млн рублей в год. При этом RPA становятся в разы производительнее, если дополнить их технологиями интеллектуальной обработки информации. С помощью таких решений роботы уже определяют тип документа или анализируют смысл текста, извлекают из него важные факты и отправляют их в различные информационные системы. Такие навыки делают роботов полноценными цифровыми помощниками бизнеса.
29 марта. Microsoft организовала комитет по этике ИИ. Вслед за ней подобные подразделения создали и другие корпорации — Facebook, Google и SAP. Игрокам есть чего бояться — ИИ не только кардинально меняет нашу жизнь, но и приносит в нее новые вызовы. Вместе с автоматизацией появляется риск, что часть людей потеряет рабочие места. ИИ дает огромное конкурентное преимущество крупному бизнесу, а это, в свою очередь, может усилить экономическое неравенство. ИИ зависит от качества и количества данных, которые используются для обучения. Их недостаток приводит к ошибкам или даже предвзятости в работе технологий. Известны примеры, когда роботы-рекрутеры принимали на работу только мужчин, отказывали в кредите людям определенной национальности или даже видели в них потенциальных преступников. В постановке медицинских диагнозов ИИ сегодня тоже недостаточно точен: по некоторым оценкам, машина не ошибается только в 60% случаев. Люди не могут во всем доверять ИИ, и для спорных ситуаций корпорациям и государствам нужно выработать общие принципы взаимодействия с технологиями: не нарушать права человека, повышать прозрачность работы ИИ, соблюдать стандарты безопасности, защищать персональные данные и не вредить.
Победил катастрофическую забывчивость
25 апреля. Аналитики Gartner опубликовали исследование: к концу 2018 года прибыль компаний от ИИ достигнет $1,2 трлн, что на 70% больше, чем в прошлом году. А в ближайшие три года ежегодный рост доходов от ИИ составит 60%. Увеличивается количество сценариев применения технологий, это заметно и по российскому рынку. За этот год ABBYY реализовала ряд крупных проектов с применением интеллектуальных технологий. Наиболее активны были заказчики в банках, нефтегазе и энергетике, появилось больше проектов в промышленности. Банк ВТБ роботизировал открытие счета для юридических лиц, а НПО «Энергомаш» — крупнейший производитель ракетных двигателей — использует ИИ для интеллектуального поиска по нескольким миллионам внутренних документов компании.
31 августа. ИИ научился помнить. Новая нейросеть отделяет распознанные объекты от окружающей их виртуальной среды, чтобы затем «представить» их в другой обстановке. Условный кактус в пустыне она распознает и в комнатном горшке. Система понимает, как объект выглядит под другим углом и освещением. Это еще одна попытка преодолеть проблему ИИ — «катастрофическую забывчивость». Традиционные нейросети не способны последовательно учиться новому и не забывать при этом старое. Подобные технологии будут особенно полезны в работе с изображениями: например, позволят лучше распознавать лица людей с разными прическами или цветом глаз.
5 сентября. Google запустила поиск по открытым датасетам. В выдаче Dataset Search указывается информация о ресурсе, на котором опубликован набор данных, авторы, лицензия, дата обновления, описание и доступные для скачивания форматы. Тематика наборов не ограничена. Конечно, это не первая подобная инициатива: порталы с открытыми данными есть у многих городов, государственных и научных организаций. Но возможность искать такие наборы и найти нужный может упростить жизнь разработчикам технологий. Данные, особенно по специфической отраслевой теме, стоят дорого, их сложно раздобыть, к тому же они быстро устаревают. Возможность использовать открытые датасеты позволит удешевить и ускорить разработку технологий, особенно если речь идет о стартапе.
24 сентября. Команда ботов OpenAI впервые проиграла людям в чемпионате по Dota 2, что удивительно, — ведь в последнее время алгоритмы все чаще побеждают человека в различных играх: Jeopardy, шахматы и го. А еще год назад алгоритм, созданный компанией Open AI, выиграл у человека в ту же Dota 2 один на один. Сентябрьское сражение показало, что машины по-настоящему сильны в индивидуальном зачете, а вот работа в команде, коммуникация, распределение обязанностей и работа в изменчивых условиях — не самые сильные стороны ИИ. С одной стороны, это яркий пример того, какие профессиональные навыки будут востребованы у людей в ближайшем будущем. С другой стороны, индивидуализм характерен для человека, а это значит, что технологии больше становятся похожими на нас самих.
Обещает полностью излечить генетические заболевания
12 октября. Человекоподобные роботы Boston Dynamics научились бегать и перепрыгивать через препятствия. Теперь они обрабатывают видео в реальном времени, а специальная программа помогает балансировать конечностям и торсу машины. За последние пять лет робот научился ходить по снегу, стоять на одной ноге и делать сальто. ИИ помогает роботам лучше ориентироваться в пространстве и работать в необычных, иногда даже экстремальных ситуациях. В ближайшие несколько лет подобных роботов будут активно использовать в условиях, где человеку опасно находиться: при производстве автомобилей, в металлургии и химической промышленности, а еще для спасения людей при чрезвычайных ситуациях.
7 ноября. ИИ научился прогнозировать болезнь Альцгеймера на ранних стадиях: распознавать изменения в участках нервной ткани, вызванные обменом веществ в определенных отделах мозга. В отличие от томографии, ИИ способен определить симптомы заболевания на шесть лет раньше. С его помощью у врачей появится возможность замедлять или вообще останавливать деменцию. 2018-й вообще можно назвать годом медицинских достижений для ИИ: технологии уже помогают выделять признаки клинической депрессии, диагностируют переломы, прогнозируют вероятность развития рака груди, ожирения и разрабатывают новые лекарства. С помощью текстовой аналитики врачи быстрее находят научные статьи в глобальной базе знаний, ставят диагноз и назначают лечение. В дальнейшем ИИ будет все активнее работать не на лечение, а именно на предотвращение болезней, в том числе на генетическом уровне: блокировать наследственные заболевания, склонность к ожирению и диабету, аллергии. Например, компания Deep Genomics обещает через десять лет полностью излечить спинальную мышечную атрофию — наследственное заболевание, повреждающее нейроны спинного мозга.
1 декабря. В России начались испытания беспилотных автомобилей на дорогах общего пользования. В эксперименте будут участвовать 100 машин, которые смогут въезжать в загруженные мегаполисы и отрабатывать различные дорожные ситуации. За три года им необходимо довести до совершенства три «навыка». Автомобиль должен хорошо ориентироваться в пространстве, быстро высчитывать безопасный маршрут и определять, как именно лучше ехать. Основная задача разработчиков — собрать как можно больше данных об экстремальных ситуациях и сложных погодных условиях. Почему автомобиль компании Uber сбил человека — нейросеть была не обучена, как действовать, когда человек в темноте неожиданно появляется на дороге. Компании стараются воссоздавать такие ситуации искусственно. Для этого они берут небольшой набор данных из реального мира: видеозаписи, 3D-карты дорог, показатели датчиков. Система варьирует эти фрагменты и создает виртуальные ДТП, падающие деревья, снежные бури и другие события, которые могут произойти на дороге — такие данные называются синтетикой. В будущем, вероятно, нужно выделить под беспилотники отдельную полосу, чтобы им не пришлось напрямую взаимодействовать с другими участниками движения. И передвигаться они пока будут очень медленно, чтобы не нанести никому увечья. Чтобы беспилотники стали по-настоящему массовым явлением, автомобиль должен научиться качественно прогнозировать ситуацию. На дорогу вылетает мяч, что произойдет дальше? Мяч остановится или полетит под колеса? Не выбежит ли вслед за ним ребенок или собака? Машина должна научиться просчитывать несколько вариантов действий одновременно.
11 декабря. Проведены первые исследования, выяснившие, насколько человек доверяет ИИ. Для этого ученые использовали алгоритмы машинного обучения и анализировали психофизиологические показатели — пульс и данные электроэнцефалографии. Исследователи определяли, как человек настроен по отношению к машине в конкретной жизненной ситуации: может ли он полностью довериться ИИ или предпочтет взять ответственность на себя. Такие эксперименты особенно важны для задач, в которых машины и люди уже действуют совместно: уход за пожилыми людьми с помощью роботов-ассистентов, сложные хирургические операции, работа в чрезвычайных ситуациях или на опасном производстве. Пока говорят о взаимодействии только одного человека и машины. В недалеком будущем потребуется слаженная координация в работе целых команд людей и роботов, и нам потребуется больше доверять ИИ.
А что ждет нас в 2019 году? Вот несколько предположений.
1. Усилится борьба за данные для обучения алгоритмов специфическим отраслевым задачам — банковским, юридическим, кадровым, в медицине, космосе, сельском хозяйстве, коммуникациях.
Растущий дефицит данных объясняется, прежде всего, коммерческой тайной и приватностью личной жизни. Банки не очень охотно предоставляют договоры со своими контрагентами, чтобы научить нейросеть находить в них риски, HR-специалисты не всегда готовы отдать стороннему разработчику даже обезличенные данные о сотрудниках, чтобы построить аналитику их вовлеченности. Информация о поведении пользователей в сети для проведения маркетинговых кампаний тоже становится менее доступна в связи с новыми законами о защите персональных данных — GDPR. Не исключено, что их будут покупать у других компаний или у людей напрямую — например, через специальные биржи.
Второй способ — в условиях ограниченного количества данных обучать технологии с помощью перспективных алгоритмов, таких как transfer learning, knowledge transfer, one-shot learning и generative adversarial networks (GAN). Метод transfer learning заключается в том, что если обучить глубокую нейронную сеть выполнять одну задачу, то можно будет использовать ту же архитектуру для обучения на другом наборе данных. Благодаря transfer learning виртуальный ассистент Alexa быстро научился понимать не только английский, но также французский и испанский и значительно расширил свой «кругозор». ABBYY использует transfer learning в своей интеллектуальной платформе ABBYY FlexiCapture: предварительно обучает сеть определять тип документа и извлекать из него информацию, чтобы затем алгоритм мог начать работать на минимальном количестве примеров уже на стороне партнера.
В методе GAN две нейросети тренируют на одном и том же наборе данных — изображений, видео-, аудиозаписей. А затем они выполняют разные задачи. Первая пытается воссоздать данные, похожие на учебные образцы. Вторая определяет качество работы первой, сравнивая полученный результат с оригинальной выборкой. Технологию уже использует, например, фармацевтическая компания InSilico: с помощью нейросетей она создает новые комбинации молекул для создания лекарственных препаратов. Разработчики компьютерных игр Ubisoft используют GAN для создания более реалистичных пейзажей в HD-качестве.
2. Увеличится спрос на разработчиков ИИ. Еще по итогам 2018-го они получали сотни тысяч долларов в год, но зарплаты дата-сайентистов продолжат расти.
Это связано с тем, что они должны обладать уникальным набором знаний, в числе которых — машинное обучение, программирование, статистика, математика, визуализация данных, глубокое обучение и коммуникация. Именно эти навыки, по данным порталов LinkedIn, Indeed, SimplyHired, Monster и AngelList, пользуются наибольшим спросом. В среднем на одного специалиста охотятся сразу три-четыре компании. Поэтому HR следует подумать, чем еще они могут привлечь специалистов высокого класса, помимо денег. В 2018 году HeadHunter провел исследование среди российских ИТ-специалистов: для 49% соискателей важны гибкий график и возможность работать удаленно, 46% желательно, чтобы у них были интересные проекты и задачи, а для 41% оказалась значимой работа в профессиональной команде.
3. В связи с ростом конкуренции за готовых специалистов корпорации будут активнее инвестировать в школьное и университетское образование.
Многие крупные компании открыли школы или курсы по машинному обучению: Google, Samsung, Яндекс, Сбербанк, «Тинькофф Банк». Лекции для школьников читают в рамках курса МФТИ и ABBYY. Уже сейчас понятно: совсем скоро компания, которая не будет учить студентов тому, что такое нейросети, как проводить эксперименты, как получать данные, потеряет конкурентное преимущество на рынке.
4. Виртуальные помощники станут более умными и от простейших действий перейдут к более сложным — смогут поддерживать телефонный разговор с человеком, записывать нас в парикмахерскую на нужное время без напоминаний или предупреждать о необходимости посетить врача.
Уже сейчас у виртуальных помощников довольно «высокий IQ»: самый умный из них, Google Assistant, правильно отвечает на 87,9% из 800 популярных вопросов. Но пока такие технологии еще не умеют выстраивать причинно-следственные связи, у них короткая память: через пару фраз они могут и не вспомнить что-то, о чем вы говорили ранее. В 2019 году это изменится, во многом благодаря развитию технологий обработки естественного языка. Они позволят таким системам лучше извлекать факты из потока неструктурированных данных, оценивать тональность произнесенной фразы (например, лучше определять иронию и сарказм), строить более осмысленный диалог с собеседником. Знания виртуальных помощников будут постепенно расширять за счет добавления информации из различных сфер деятельности, как бытовых вопросов, так и профессиональных задач.
5. Разработчики будут уделять больше внимания интерпретации результатов работы нейросетей.
Сейчас в 99% случаев технологии ИИ напоминают черный ящик: система получает данные, обрабатывает их и выдает результат. Например, определяет, какой кредит и с какими процентами можно дать клиенту, вычисляет задержку авиарейса, выбирает готовый ответ на обращение пользователя. Но мы не всегда понимаем, почему она приходит к этому выводу, на основании чего выбираются те или иные гипотезы, какие признаки и вводные считает значимыми, какие оценки учитываются. Это затрудняет работу бизнеса и людей с системой, так как не всегда можно доверять выводам без аргументов.
Поэтому исследователи все больше интересуются не только качеством решения задач с помощью моделей, но и тем, насколько хорошо нейросети способны передать какое-то лингвистическое или математическое явление. Эту тему, например, активно обсуждали в октябре на крупнейшей конференции по технологиям обработки естественного языка в Брюсселе — Empirical Methods in Natural Language Processing. Разработки в области «объясняемого ИИ» особенно активно ведутся в здравоохранении, инвестиционных компаниях и банках, в производстве самоуправляемых автомобилей, в робототехнике — областях, где неверное решение ведет к финансовым потерям или рискам для жизни.