Кейсы 6 ноября 2019

Data science в медицине: кардио-МРТ с ИИ, умное планирование лучевой терапии и случайное обнаружение болезней

Далее

Эпоху, в которой мы живем, называют информационной эрой. Каждый из нас ежесекундно имеет доступ к такому количеству данных, какое до широкого распространения интернета люди не могли и представить. Онлайн-шопинг и общение, наши ежедневные поисковые запросы — именно активность в интернете стала источником огромного массива информации, который принято называть Big Data. Но ключевую роль анализ больших данных сегодня играет в медицине, помогая врачам ставить диагнозы, случайно обнаруживать болезни и точно рассчитывать параметры лучевой терапии. Ведущий научный сотрудник лаборатории Philips Research в «Сколково» Ирина Федулова рассказала о том, как анализ больших данных меняет здравоохранение и какие проекты реализует лаборатория компании Philips в сфере Data science.

Новая наука XXI века

Существование больших данных не имело бы смысла, если бы их никто не анализировал и не систематизировал. Но вручную работать с такими объемами невозможно — необходимо применять специальные методы, основанные на компьютерных мощностях, которые позволяют использовать в полной мере потенциал собранной информации. Этим и занимается Data science — наука о данных.

Профессия дата-сайентиста стала одной из самых востребованных специальностей в XXI веке. Ключевое направление этой дисциплины — машинное обучение. От стандартного программирования оно отличается тем, что специалист не пишет алгоритм, по которому работает компьютер, а учит машину создавать программу без человеческого участия на основе собранных данных. Сегодня большинство людей сталкивается с приложениями, построенными на основе машинного обучения, неоднократно в течение дня: навигатор благодаря ему самостоятельно строит маршруты, различные онлайн-сервисы рекомендуют фильмы, музыку и еду. Если рассматривать менее очевидные на бытовом уровне задачи, можно вспомнить о том, насколько интенсивно машинное обучение используется в безопасности — например, для контроля государственной границы или в логистике для навигации, доставки, оптимизации товаров на складе. В финансовой сфере подобные технологии нужны для управления рисками, алгоритмической биржевой торговли, кредитования и страхования.

Data science в медицине

Растущая необходимость в специалистах по Data science есть и в медицине. Цифровизация — безусловный тренд в здравоохранении, и это подтверждается заинтересованностью государств. Например, в России в рамках нацпроекта «Здравоохранение» на внедрение инновационных медицинских технологий выделено 63,9 млрд рублей.

Среди крупных технологических компаний одними из пионеров применения Data science в медицине стали компании Google (проекты в рамках направления Google Health) и IBM, которые создали линейку решений под маркой IBM Watson, и сейчас активно используют их в здравоохранении: портфолио IBM Watson Health включает в себя платформы для онкологии, кардиологии, радиологии и других разделов медицины.

Программы, созданные на основе машинного обучения, помогают врачам принимать более обоснованные решения и назначать максимально подходящее лечение. Например, чтобы полностью видеть картину заболевания и автоматически оценивать состояние пациента не только во время приема, но и между визитами, можно использовать носимые устройства — фитнес-трекеры и браслеты, специальные мобильные приложения. В некоторых странах гаджеты уже могут передавать показатели здоровья напрямую в базы данных медицинских учреждений, а электронная система анализирует информацию, выявляет возможные отклонения и с помощью уведомления подсказывает врачу, когда пациенту требуется консультация.

В конечном итоге все новшества в здравоохранении нужны, чтобы повысить качество и снизить стоимость медицинской помощи. Data science позволяет врачу уделять больше времени пациенту, пока компьютер быстро и точно анализирует массив данных. В лабораториях Philips Research занимаются множеством аспектов Data science: научные сотрудники работают над проектами в области распознавания образов и обработки изображений, анализа медицинских текстов, поиска аномалий, рекомендательных систем. Дата-сайентисты здесь принимают участие в создании интеллектуальных систем и занимаются изобретательской деятельностью.

Цифровая помощь в анализе изображений

Один из приоритетов специалистов по Data science в Philips Research — разработка инновационных подходов к автоматическому анализу медицинских снимков. Ученые стремятся автоматизировать некоторые из задач врачей, деятельность которых связана с оценкой изображений — например, рентгенологов и патоморфологов.

Как именно ИИ улучшает качество оценки изображений, можно увидеть на примере рентгенологии. Каждый день врачи применяют свой опыт и знания, чтобы делать правильные выводы на основании снимков. Имея тысячи изображений, которые уже обработал и разметил профессионал, можно обучить нейронную сеть распознавать отклонения на новых снимках. Натренированная на большом количестве примеров из базы данных нейросетевая модель анализирует картинку и делает вывод о наличии заболевания. Такая схема может быть полезна для массовых обследований населения: например, в некоторых странах есть национальные программы диагностики туберкулеза на основании флюорографии. Система сможет отсеивать снимки, на которых не обнаружено патологий, и предоставлять врачам только те случаи, когда состояние пациента вызывает сомнения. На данный момент подобные решения находятся на стадии разработки и проходят клиническую апробацию.

Data science в МРТ и КТ

Возможности ИИ все чаще применяются в магнитно-резонансной томографии. Оценка изображений, полученных этим методом, порой требует много времени и усилий. За время одного исследования врачи могут получить десятки снимков. Чтобы помочь врачу проанализировать этот массив данных, ученые внедрили в работу МР-сканеров искусственный интеллект, который оценивает качество снимка, рассчитывает жизненно важные параметры и сравнивает результаты с предыдущими показателями для выявления динамики заболевания.

Например, для исследований сердца Philips создал кардио-МРТ, один из самых современных методов диагностики кардиологических заболеваний. После того, как получены снимки, для определения эффективности работы сердца необходимо вычислить объемы камер сердца в сокращенном и расслабленном состояниях. Специалисты предполагают, что эти действия можно поручить ИИ, обученному выделять на снимках сердечную мышцу, стенки, клапаны, сосуды и самостоятельно рассчитывать объемы камер. Сейчас в разработке находятся прототипы моделей, которые дадут возможность врачам тратить меньше времени на решение рутинных задач и больше концентрироваться на постановке диагноза.

Еще одна разработка дата-сайентистов — возможность генерировать один вид изображения на основании других. В медицине это применимо, когда пациенту требуется несколько процедур: компьютерная томография и МРТ, что требуется, например, при планировании лучевой терапии, когда необходимо точно очертить контуры областей для облучения, а также соседних здоровых органов, которые облучать не надо. Для расчета дозы необходимо также знать рентгеновскую проницаемость всех тканей, через которые будут проходить рентгеновские лучи. Информацию для точной оценки контуров зон облучения лучше всего дает МРТ-исследование, которое безвредно для человека. Однако МРТ-изображение не несет информации о рентгеновской проницаемости тканей — эту информацию можно получить только при помощи КТ. К сожалению, компьютерная томография основана на рентгеновском излучении, вредном для человека. На его изображении хуже видны контуры различных мягких тканей, поэтому пациентам приходится делать и КТ, и МРТ, а потом совмещать две картинки. Чтобы снизить уровень лучевой нагрузки, особенно если пациент — ребенок, а также снизить общую стоимость планирования операции, ученые создали метод генерации синтетического КТ-изображения по данным МРТ. Согласно ему обученная программа учиться генерировать КТ на основе существующих МРТ. В итоге пациент проходит одну процедуру вместо двух. Таким образом уменьшается время и стоимость обследования, а главное — доза облучения.

Data science и патоморфология

Несмотря на многообразие неинвазивных методов диагностики, в онкологии точный диагноз может быть поставлен единственным способом — с помощью анализа ткани через микроскоп. Именно этим занимается патоморфология. В помощь врачам-патоморфологам дата-сайентисты создают алгоритмы для обработки изображений клеток, подобные тем, которые распознают людей и различают предметы на фотографиях. Это специальные системы принятия врачебных решений, которые выявляют и классифицируют пораженные клетки, а затем сообщают врачу о своих находках. Кроме того, специалист сразу же получает дополнительную полезную информацию (например, сведения о концентрации клеток, стадии заболевания, особенностях внутриклеточных процессов и так далее), которая помогает ему при постановке диагноза.

Почему использовать Data science для здравоохранения непросто

Как любая молодая наука, Data science все еще сталкивается с определенными вызовами. Если говорить о медицине, на первый план выходит этический аспект. Исследование Philips «Индекс здоровья будущего — 2019» показало, что главным барьером на пути к внедрению цифровых медицинских технологий является обеспокоенность вопросом конфиденциальности данных. Люди хотят знать ответ на вопрос, насколько защищена информация, которую они предоставляют компьютеру для анализа или передают врачу дистанционно.

Людям будет проще принять изменения в медицине, когда каждый поймет, что инновации создаются не для того, чтобы заменить врачей в их работе. Цифровые технологии лишь помогают профессионалам принимать наиболее точные и обоснованные решения. Нейросеть может определять наличие некоторых заболеваний по симптоматике и предлагать варианты назначений, но пациенты могут быть уверены, что последнее слово по-прежнему за врачом — только он может поставить окончательный диагноз и определить необходимое лечение.

Сложности в Data science возникают не только в этическом поле, но и с технической стороны. В здравоохранении зачастую не хватает полных, консистентных, репрезентативных, предварительно размеченных данных, на основании которых можно было бы обучать машину анализировать материал, классифицировать его и составлять прогнозы. Сбор и обработка медицинской информации должна проводиться вручную, это трудоемкий, монотонный и долгий процесс, на который зачастую не хватает ресурсов.

Даже если данных достаточно, проблемы могут возникнуть уже на этапе использования готового алгоритма. Многие заболевания эволюционируют, да и для традиционных болезней характерна большая вариативность признаков. Нельзя предсказать, как поведет себя система, если столкнется с нестандартной ситуацией. Представим себе алгоритм, обученный обнаруживать патологии в сердце, которое у подавляющего большинства людей находится в левой части грудной клетки. Но что произойдет, если однажды он столкнется с редкой особенностью анатомического развития — декстрокардией, при которой сердце находится справа? Большинство алгоритмов может выдавать только финальное решение — да или нет, норма или патология. Ни один алгоритм пока не может сообщить: «Я такого никогда не видел и не знаю, что это». Поэтому сейчас важно научить компьютер не только давать ответ, но и оценивать степень достоверности полученных результатов.

Инновации в ответ на современные вызовы

Главные вызовы здравоохранения — это рост населения, снижение доступности медицинской помощи, увеличение продолжительности жизни и, как следствие, частоты хронических заболеваний. Чтобы решить эти проблемы, ученые стремятся вывести медицину на новый уровень. Например, Data science сделает возможным случайное обнаружение болезней (на англ. incidental finding — «Хайтек»). Врачи обычно рассматривают анализы и снимки в свете того диагноза, с которым пришел пациент. В то же время машина, умеющая различать сотни болезней, может обратить внимание специалиста на другие отклонения от нормы — например, найти рак легких на снимке с переломом ребра. Одна из целей машинного обучения в медицине — помочь врачам проверять человека на всё и сразу при минимальном количестве исследований.

Другое направление, которым занимается Philips Research, — это прогнозная аналитика, то есть предсказание заболеваний в зависимости от местности и группы населения. Если будут учитываться медицинские показатели миллионов человек, можно будет находить взаимосвязи и закономерности, выяснять, почему где-то одни заболевания распространены больше, чем другие, и затем на основании полученной информации определять группы риска и проводить профилактику до возникновения вспышек болезней.

Внедрение новых технологий может быть долгим процессом, осложняться этическими, правовыми и финансовыми вопросами. Однако наука о данных не была бы так востребована, если бы не позволяла справляться с проблемами более эффективно. Это понимание уже приходит к государственным структурам, которые включают цифровизацию здравоохранения в официальные программы, и к крупным компаниям, которые нанимают все больше специалистов по Data science. По оценкам аудиторской компании KPMG, с каждым месяцем инвесторы вкладывают все больше средств в развитие ИИ в медицине. Так, в первом квартале 2018 года сумма венчурных инвестиций в соответствующие проекты превысила $320 млн. Поэтому исследователи в лабораториях Philips Research верят, что в недалеком будущем инновации войдут в ежедневную практику врачей и помогут повысить качество жизни по всему миру.