Кейсы 15 апреля 2022

Предсказать всю биологию вплоть до белков: как ИИ знает о нашем организме больше, чем мы

Далее

Программное обеспечение от DeepMind, которое может предсказывать трехмерную форму белков, уже меняет биологию. «Хайтек» разбирается, как искусственный интеллект помогает ускорять биологические открытия и где он может ошибаться.

Предсказать генетическое заболевание и создать новое лекарство может не только человек, но еще и искусственный интеллект, причем последний справляется с задачей гораздо быстрее.

Как биологи изучают человеческие белки?

Более 10 лет молекулярный биолог Мартин Бек вместе с коллегами пытался создать детальную модель ядерно-поровых комплексов. Бек называет ее самой большой молекулярной машиной в клетках человека. Комплекс ядерных пор контролирует поток молекул, которые поступают в ядро клетки и из него — туда, где находится геном. Сотни таких комплексов существуют во всех клетках. Каждый из них состоит из более чем 1 000 белков.

Эти тысячи кусочков образуют более 30 белковых строительных блоков, которые по-разному переплетаются: поэтому работать с ними еще сложнее. В 2016 году команда под руководством Бека из Института биофизики Макса Планка (MPIB) сообщила, что создала модель, которая описывает около 30% от комплекса ядерных пор и почти половину строительных блоков, иначе говоря, белков Nup.

Как алгоритмы изучают человеческие белки?

В июле 2021 года фирма DeepMind, входящая в Alphabet — материнскую компанию Google, — представила ИИ под названием AlphaFold. Это программное обеспечение могло предсказывать трехмерную форму белков по их генетической последовательности. Вычисления проходили на высокой точности. Это серьезно изменило задачи и интерес биологов.

Используя AlphaFold, ученые смогли предсказать, какая форма у человеческого белка Nup. А позже опубликовали модель, которая описывает 60% комплекса ядерных пор. Это помогло понять, как комплекс стабилизирует поры и контролирует поток молекул.

AlphaFold-мания: почему ИИ для изучения структуры белков стал так популярен?

По словам биологов, все научное сообщество охватила AlphaFold-мания. ИИ начали применять для огромного количества исследований. В некоторых случаях алгоритм помог сэкономить время или позволил получить новые данные. Но у ИИ есть и ограничения: некоторые ученые считают его прогнозы слишком ненадежными для своей работы. Тем не менее все признают, что алгоритм справляется с обработкой данных лучше всех.

Даже сами разработчики алгоритма не всегда успевают понять, в какой еще области можно его использовать: поэтому часто они просто наблюдают как группы исследователей совершают новое открытие с помощью AlphaFold: начиная от открытия лекарств и разработки белков, заканчивая происхождением сложной жизни.

В середине июля 2021 года в открытом доступе появился открытый исходный код ИИ, а также другая информация, которая поможет ученым начать проводить подобные исследования в рамках своих работ. Неделю спустя DeepMind объявила, что использовала AlphaFold для прогнозирования структуры почти всех белков, которые вырабатывает человек. Всего команда изучила 365 000 биологических структур. Сегодня эта база данных расширилась почти до миллиона структур.

В 2022 году компания DeepMind планирует выпустить всего более 100 млн прогнозов о биологической структуре организмов. Это почти половина всех известных белков — также это число в сотни раз превышает белки, которые удалось определить экспериментально.

Инструмент уже помог исследователям найти новых потенциальных белковых партнеров. Ученые использовали AlphaFold для прогнозирования структур 65 000 пар человеческих белков. А другая группа применила AlphaFold и RoseTTAFold, чтобы смоделировать взаимодействия почти между каждой парой белков, кодируемых дрожжами. В результате они нашли более 100 ранее неизвестных комплексов ядерных пор.

Как работает AlphaFold?

AlphaFold использует нейронные сети с глубоким обучением: это вычислительная структура, которая работает как человеческий мозг и распознает закономерности в данных. Алгоритм обучили с помощью сотен тысячи белковых структур, которые определили экспериментально. Если ИИ столкнется с новой последовательностью, он сначала ищет похожие случаи в базах данных.

AlphaFold перебирает подсказки, пытаясь смоделировать 3D-изображение аминокислот. Специалисты считают, что в этом программном обеспечении удачно применили новые идеи для машинного обучения. В частности, они отмечают уникальный механизм, который называется «внимание» — он определяет, какие аминокислотные соединения наиболее важны для работы в данный момент.

В чем проблема AlphaFold?

Прогнозы AlphaFold зависят от информации о родственных белковых последовательностях, поэтому у ИИ есть некоторые ограничения. Например, алгоритм не может прогнозировать влияние мутаций на форму белка, в частности тех, которые вызывают заболевания.

Он также не может определять, как белки меняют форму из-за других взаимодействующих белков или молекул, например, лекарственных. Но модель может оценивать уверенность в собственном прогнозе для каждой аминокислотной единицы белка. По данным DeepMind на август 2022 года, более 400 000 человек использовали базы данных AlphaFold EMBL-EBI.

Чем такие алгоритмы помогут обычным людям?

Исследователи из фармацевтических компаний и биотехнологических фирм в восторге от потенциала AlphaFold и говорят, что алгоритм помогает открывать новые лекарства.

Карен Акинсанья, руководитель разработки разработкой терапевтических средств в фирме Schrödinger, отмечает, что она и ее коллеги работали с AlphaFold и получили результаты, которые можно назвать успешными. Они сумели разработать соединения, которые потенциально могут стать лекарствами.

Читать далее:

В MIT создали неподвижный тепловой двигатель, который превзошел КПД турбин

Спустя десять лет работы ученые усомнились в стандартной модели физики

Посмотрите, как выглядит восход Солнца на Марсе