Лаборатория Mind Simulation на AI Conference показала демо своего чат-бота Steve с ИИ: программа отвечала на вопросы пользователей, используя ядро своей технологии — Core Expert. В будущем Core станет универсальным ИИ, способным решать многие задачи в образовании, банкинге, медицине и повседневной жизни вместо людей. Василий Мазин, директор по научным исследованиям Mind Simulation, рассказал «Хайтеку», как решение кубанских математиков поможет преодолеть «зиму» ИИ, чем их Steve лучше «Алисы» и Alexa и как голосовые помощники будут общаться между собой без участия человека.
Персональный ассистент с ИИ
— Расскажите о проектах вашего стартапа — Core Expert и Steve.
— У нас не совсем стартап в традиционном понимании, а скорее научная лаборатория. Сейчас мы сосредоточены на разработке интеллектуального ядра, которое называется Core Expert, подобрали под разработку специальную команду. Она ориентирована на два проекта. Core — сама модель и технология, ядро. И Steve — пример, как технология может использоваться в одной задаче — персональный ассистент с ИИ, который сможет вести полноценный диалог на любые темы.
— Чем вы занимались до этого?
— Один из моих предыдущих проектов — это Urban, моделирование распространения опасных факторов пожара. Там использовалась физика и математика. Это был коммерческий b2b-проект. Например, экспоцентр, где мы сейчас находимся, должен иметь документы о том, что происходит при пожаре. Модель делается в программе, и одна из таких программ — наша. Там чертятся 2D- и 3D-модели здания, расставляются люди, просчитываются разные сценарии пожара.
— Как технологически связаны нынешний проект и тот?
— Никак не связаны. ИИ меня интересовал еще тогда, когда я в университете занимался наукой. Я работал 16 лет в Кубанском государственном университете на факультете прикладной математики. Несмотря на то, что защитился по другой специальности, со студентами в курсовых и дипломных работах часто использовал ИИ.
Хотел создать лабораторию в университете, и первоначальные договоренности были. Но из-за жесткой бюрократии тяжело было спокойно это воплотить в реальность. В итоге вместе с коллегами и партнерами основал лабораторию ИИ. И уже можно посмотреть, что мы за прошлый год перенесли из методологии на бумаге в конкретное решение.
Когда-то у ИИ будет столько же нейронов, сколько в человеческом мозге
— Давайте поговорим о Core Expert. У вас на сайте написано, что цель — создать универсальный ИИ. В чем заключается его универсальность?
— Есть так называемые ИИ-полные задачи. Возьмем одну из них — диалог на естественном языке. Для того, чтобы компьютер с вами разговаривал и работал естественно, как человек, нужно очень потрудиться. Эта задача очень сложная и практически невыполнимая. Ее может решить так называемый сильный ИИ. Это интеллект, который по возможностям не уступает человеческому. Есть меньшая ступенька — универсальный ИИ, то есть такой, который не нужно переписывать каждый раз под конкретную задачу.
Сейчас как делается: берется задача, под нее подстраивается модель из существующих. «Ага, тут мы нейронную сеть будем использовать, а тут мультиагентные системы».
Наша идея — создать единое ядро, которому все равно, какая проблема будет стоять перед ним. Внутри — структура представления знания, обработки его не меняются. Это универсальное решение. А когда дорастет до человеческого уровня — будет сильный ИИ.
— ИИ совсем не новая технология, неужели не возникало похожих проектов?
— Сейчас никто ничем подобным не занимается. А первый проект по разработке универсального ИИ возник еще в 1950-х годах. Те, кого мы знаем как основоположников ИИ, размышляли так: «Давайте летом на каникулах встретимся, — они были в академической среде. — И за недельку-две создадим универсальный ИИ». Понятно, что ничего не получилось, и с тех пор эта задача возникает постоянно.
Тема универсального искусственного интеллекта очень гремела в 70–90-х годах, а потом наступила тишина. Это связано с тем, что как только начинали ее решать, утыкались в технологический, алгоритмический или еще какой-то тупик. Все это стало немного скандальным направлением, поэтому сейчас очень осторожно про него рассказывают.
Сегодня мы видим большой всплеск интереса к ИИ: появилось оборудование, позволяющее обрабатывать глубокие нейронные сети, глубокое обучение. Все понимают, что классические нейронные сети, которые сейчас используются, не позволят достичь универсальности из-за жестких ограничений самой технологии. Может быть, когда-то там будет столько же нейронов, сколько в человеческом мозге, в них будут разные структуры, они будут скомбинированы друг с другом. Тогда и решится проблема. Мы в эту сторону даже не смотрим: может быть, в ближайшие 100 лет и оборудования не будет, которое это потянет. Поэтому занимаемся немного другим.
Разработчикам выгодно, чтобы чат-бот давал максимальное число правильных ответов
— Сколько человек у вас работают над созданием ИИ?
— Сейчас десять человек трудятся в Краснодаре. В марте, может быть, добавятся еще два. В основном это выпускники прикладной математики, где я преподавал. Часть из них — мои бывшие дипломники, студенты и аспиранты.
— В каких сферах может использоваться универсальный ИИ?
— Сейчас Steve — это демонстрация возможностей ИИ, а не цельный продукт. Его надо показывать кому-то, кто понимает внутреннее устройство ИИ, чтобы максимально эффективно раскрыть. Это просто такое демо. Со временем он будет трансформироваться в полноценный продукт с голосовым интерфейсом. Без голоса такой продукт уже невозможен. А обучение может быть по-разному выстроено. Например, вы хотите узнать, какие направления музыки есть, а Steve может рассказать о них и протестировать вас — дать музыкальные отрывки, чтобы понять, разбираетесь вы в музыке или нет. Он выстроит персональный образовательный курс.
Одна из моих разработок «на коленке» — программа в помощь студентам художественного факультета. У них на первом-втором курсе есть предмет, где нужно знать картины, кто их автор, когда они написаны. И нужно знать тысячи таких картин. Приложение создавало систему, по которой студенты могли обучаться, тестировать себя. Это все может переместиться в Steve. Даже учить не надо.
Сейчас мы ведем переговоры с партнерами из сфер банкинга и медицины. В клиниках, например, это может быть консультант. Он поможет выявить проблему и определить врача, к которому следует обратиться. Сейчас волна чат-ботов на пике, и понятно, что нужно внедрить продукт, предлагающий большие возможностям. Консультирование — самое простое, со временем ИИ сможет брать на себя все большие обязанности.
— Это отсекает работу колл-центра?
— Да, это его замена. Сбербанк туда идет. В нескольких банках такое внедрили, они рапортуют, как много денег сэкономили, что появилась поддержка 24/7, как улучшилась поддержка клиентов. Понятно, что процент правильных ответов в районе половины.
—Что значит правильных?
— Тех, которые соответствуют тому, что подразумевал пользователь. В чат-боты в основном какая-то обработка нейронными сетями идет, а вероятность ошибки очень большая. По-другому человек сформулирует запрос — и все, ответ может прийти из другого кластера ответов. Соответственно, система ответит не на тот вопрос, который задал человек.
Сейчас схема монетизации такая: оплата создателям бота идет за каждый правильный ответ. Неправильный не считается, а за правильный, например, 5 рублей. «Модульбанк» так работает. Получается, разработчикам выгодно сделать так, чтобы было максимальное число правильных ответов.
«Готовых ответов нет»
— Почему сейчас невозможно создать продукт без голоса?
— Есть «Алиса», есть Alexa, они все с голосом. Возможность общаться текстом важна, но это прошлый век. Если мы хотим создать интеллектуальный продукт, то голос ему необходим.
— А чем Steve концептуально отличается от «Алисы» и Alexa?
— Steve думает. «Алиса», Alexa и остальные — нет.
— «Алиса» обучается от взаимодействий с пользователями.
— Да, только не совсем понятно, чему. Да и сам термин «обучение» в отношении «Алисы» и других ассистентов сильно искажен, как и понятие ИИ в целом. Никто не знает, чему она обучается. Возьмем «Алису»: она из всех представленных наиболее интересная. Там три направления: она либо отправляет в поиск, либо у нее есть шаблон, который помощник может дать как ответ по алгоритму; если ни туда, ни туда она не отправляет, запускается нейросеть, по которой выдается ответ. Нейросеть берется из опыта диалога с пользователями, и никто не знает, на какой вопрос и что она может ответить. «Алиса» просто выбирает фразу с наибольшим «весом». Интеллекта и мышления здесь нет.
В нашей системе ответов не заложено. Каждый ответ генерируется с помощью внутреннего мышления. Мы можем отследить цепочку суждений нашего ИИ, а другие нет, так как нейронные сети — это «черный ящик». В будущем Steve сам сможет объяснять, почему он думает так, а не иначе.
— Вы под внутренним мышлением имеете в виду универсальный ИИ, который позволяет обучаться не на основании диалогов?
— У нас достаточно будет один раз прочитать книгу, документ или просто услышать информацию. А в нейронных сетях требуется много циклов обучения.
Рассмотрим кейс банка, например. Нужно сделать интеллектуального помощника. Достаточно будет списка инструкций, который они дают сотрудникам колл-центра. Этого будет достаточно, чтобы обучиться и начать работать.
— Steve будет обращаться к базе текстов, если ему чего-то не хватает?
— Если вы захотите его чему-то обучить, ему нужно, как и человеку, предоставить материалы. Человек пришел, он хочет быть консультантом — вот список документов, которые нужно изучить. Тут есть другая особенность — Steve будет отвечать по-своему. Готовых ответов нет, и они будут генерироваться автоматически, грубо говоря, он будет все эти знания своими словами рассказывать. Внутри Steve не думает на естественном языке, у него собственное представление и образное мышление. Поэтому есть вариант цитирования. Если, например, вам нужно процитировать какой-то параграф инструкций или другого правила, он не будет синтезировать его из знаний, а возьмет этот кусок и приведет целиком.
— Что это за тексты, кто их составляет?
— Есть несколько этапов обучения. Первый этап — когда ядро пустое, у него никаких знаний нет. Тогда нужно создать некоторую карту знаний — начальные представления об устройстве мира. Эта часть выполняется экспертом. Мы пытались пару раз сделать это автоматически, но получалось некрасиво и не то, что надо.
Автоматически — значит дать большой корпус текстов и попытаться вытащить какие-то знания оттуда, используя статистические методы. Это не получалось. Как выяснилось, если мы хотим составить картину мира, никакие тексты не помогут, потому что существует огромное количество умолчаний. То, что с самого детства откладывается, то, с чего мы начинаем постигать мир, никто в текстах не прописывает. Поэтому и появляются огромные проблемы в знаниях. Соответственно, если никто это не пишет, статистический метод не найдет там ценные знания. В итоге вернулись к тому, что начальную карту знаний составляют эксперты.
Следующий этап — углубить эту карту знаний. Вот здесь уже можно работать с большим корпусом текстов. У нас такой собран — там 7 млрд слов. Мы третий раз уже составляем этот корпус, а первые два были неправильно сбалансированы. В них нужен баланс — научные тексты, исторические, художественные, статьи, новости. Один раз мы переборщили с новостями, и там появились «выбросы» (статистический термин — «Хайтек») по знаниям.
Дальнейший этап начнется, когда будет достигнута некоторая критическая масса знаний, — он начнет просто читать тексты. Хотим мы, например, банковскому делу обучить — вот книжечка по банкам, внутренние инструкции, и он их однократно читает.
Мы делали такие эксперименты с «Курочкой Рябой» и «Репкой», и даже на нынешнем уровне развития ИИ все хорошо получалось. Далее мы будем делать то же самое, но на намного более сложном уровне.
— Что это за эксперты, которые подготавливают базу текстов?
— У нас два человека, которым ставится задача проверки корректности входящих знаний. Мы часто используем мозговой штурм, а иногда приходится обращаться к экспертам.
— К лингвистам?
— Не только, хотя и к ним обращались, когда формировали языковые модули. Чаще к психологам и философам. У нас была очень узкая проблема, и философы подсказали, как ее можно решить. Тут важен не текст, а понимание того, как это все связать воедино. Год назад этого понимания изначально не было. Решение теперь найдено.
— Почему нужно приглашать экспертов из гуманитарного поля, а не решать технически?
— Проверить легко. Как самым простым способом посмотреть, что это универсальный интеллект? Давайте сделаем естественный диалог. Будете общаться с ним — сразу увидите: что-то не так. Когда мы собрали первую итерацию и посмотрели, что он умеет и как может отвечать, увидели огромные пробелы и непонимание.
Как преодолеть зиму ИИ
— Как вы оцениваете возможности для продажи технологии универсального ИИ?
— Сейчас очень модно выделять деньги на что-то, связанное с нейронными сетями, потому что это на слуху. Правда, появились уже звоночки, что сети не решат все проблемы. Недавно была статья главы ИТ Сбербанка, которая так и называлась — «Зима искусственного интеллекта». Это уже пятый или шестой виток: предсказывают «зиму», и она приходит.
Когда я этим занимался в 2006 году, мне говорили: «Чем ты занимаешься, нейронные сети — это отстой». Тогда была «зима», и нейронные сети были в упадке. В 2009 или 2010 году произошел прорыв. Благодаря продвинутому оборудованию появилась возможность работать с глубинными нейронными сетями. Много нейронов, много слоев, можно по-разному обучать. Но теоретические ограничения, которые изначально еще описывались в 1970-х, не преодолеваются этим оборудованием. Поэтому сейчас все, что можно сделать, решат этими нейронными сетями, а дальше где развитие? В эту тему никто академически в не вкладывается. Кто помнит эти взлеты, те с недоверием относятся к новой технологии.
— Как вы представляете развитие своего стартапа, если действительно настанет такая «зима» и интерес угаснет?
— Наш стартап создан для того, чтобы эту «зиму» преодолеть. Возможно, все перейдут на тот подход, который мы предлагаем. Звоночки уже появляются: зачем упираться в одну технологию, если можно начинать комбинировать? Тогда и пойдут гибридные модели.
— Почему в академической среде никто не продолжает исследование?
— В академической среде должны выделяться гранты. А они выделяются под что-то понятное и известное. Что мы сейчас предлагаем — эта технология может быть непонятной и неизвестной. Поэтому к ней относиться будут с опаской. Потихоньку будем ее освещать.
— Когда вы сможете показать диалог на естественном языке?
— Разработка идет циклично. Каждый цикл состоит из этапов, и в конце происходит демонстрация чего-то. Первый цикл закончится в феврале 2019 года, и тогда это будет диалог на естественном языке на достаточно высоком уровне. Все это будет нетребовательно к оборудованию и сможет работать без интернета.
— Есть ли у вас предложения не для бизнеса, а для потребителей?
— Для потребителей — просто интеллектуальный помощник Steve, который вы можете установить себе на телефон, например, и общаться. Наша основная цель — создать полноценного собеседника, а не только помощника. Вы сможете поговорить на любую тему с ним, даже личность ассистента можно будет подстроить под себя. Даже просто как психологическую разгрузку.
— Какие у вас есть конкуренты в b2c-сегменте?
— Прямых конкурентов нет. Есть очень отдаленно напоминающая наше решение Viv, из нее потом Samsung сделал Bixby. Внутри она устроена по-другому, но визуально на конференциях представляли что-то похожее: одно приложение — все задачи.
— Каким вы видите свой голосовой помощник через несколько лет? Что он сможет делать?
— Он будет стоять у каждого, вы с ним сможете общаться, он будет решать большинство ваших рутинных проблем. Освобождает вашу жизнь для вас самих.
— В чем преимущество вашего решения над Alexa или Siri?
— С ними нельзя просто пообщаться нормально, нельзя научиться чему-то. Проще говоря, голосовые помощники сейчас — это просто голосовой поиск, который завернут в интерфейс колонки или бота. В поиске вы сначала увидите рекламу, потом SEO-ссылки, и только потом решение. Им постоянно требуется интернет для работы. Напрямую ответ они могут дать: грубо говоря, на часто задаваемые вопросы оформляют карточки с ответом. Но это практически ручная работа, этим не охватишь все.
Вы обращаетесь с проблемой, и голосовой помощник напоминает: «Пройди обследование такое-то, ты у зубного полгода не был, могу тебя записать прямо сейчас». Если это станет массово, то он позволит общаться с другими людьми, когда они напрямую не смогут. Помощник связывается с другим помощником, у того есть расписание, он может уточнить, сможете ли вы тогда-то встретиться. Помощники будут брать бэкграунд, неинтересные вещи, нудные. Просто даже разговаривать с вами: устали вы, некому все высказать — вот, расскажите помощнику.