;
Кейсы 5 августа 2022

Программа нашла все 200 млн белков, известных науке: как это возможно

Далее

Группа искусственного интеллекта DeepMind раскрыла структуру почти каждого белка, известного науке. «Хайтек» рассказывает главное о новом исследовании.

Исследователи составили базу из 200 млн белковых структур. Они добились этого с помощью программы AlphaFold, которую DeepMind разработала в 2018 году и выпустила в июле 2021 года. Программа с открытым исходным кодом предсказывает трехмерную структуру белка на основе последовательности его аминокислот — строительных блоков, из которых состоят протеины. Структура белка диктует его функции, поэтому база данных, идентифицированных AlphaFold, поможет определить новые рабочие функции белка, которые могут использовать люди.

Парадоксальные белки

Белки — строительные блоки жизни. Они производятся различными организмами — от бактерий до растений и животных, и когда они образуются, то складываются за миллисекунды. Сформированные из цепочек аминокислот, свернутых в сложные формы, их трехмерная структура во многом определяет их функцию. Стоит выяснить, как складывается белок, можно понять, как он работает и изменить его поведение. 

Хотя ДНК предоставляет инструкции для создания цепочки аминокислот, предсказать, как они взаимодействуют, чтобы сформировать трехмерную форму, было очень сложно. До недавнего времени ученые расшифровали лишь часть из 200 млн белков, известных науке. Проблема в том, что их структура настолько сложна, что пытаться угадать, какую форму они примут, почти невозможно.

AlphaFold от DeepMind создал 3D-изображения белковых структур. Изображение предоставлено DeepMind

Сайрус Левинталь, американский молекулярный биолог, писал в статье 1969 года о парадоксе: несмотря на огромное количество возможных конфигураций, белки сворачиваются быстро и точно. При этом каждый белок может принять от 10^300 возможных конечных форм.

Таким образом, писал Левинталь, если кто-то попытается найти правильную форму белка, пробуя каждую конфигурацию одну за другой, потребуется больше времени, чем существует Вселенная.

Попытки ученых

У ученых есть способы визуализировать белки и анализировать их структуру, но это слишком медленная и трудная работа. По данным журнала Nature, чаще всего для изображения белков применяют рентгеновскую кристаллографию. При этом методе рентгеновские лучи направляют на твердые кристаллы белков и измеряют то, как они преломляются. Цель — определить, как устроен белок. По данным DeepMind, эта экспериментальная работа установила форму около 190 000 белков.

Новый метод

В ноябре 2020 года группа DeepMind, занимающаяся искусственным интеллектом, объявила о разработке программы под названием AlphaFold, которая может быстро предсказывать эту информацию с помощью алгоритма. С тех пор он изучает генетические коды каждого организма, чей геном был секвенирован, и предсказывает структуры сотен миллионов белков, которые они вместе содержат.

AlphaFold работает, накапливая знания о аминокислотных последовательностях и взаимодействиях, пытаясь интерпретировать белковые структуры. В итоге алгоритм научился предсказывать формы белков за считанные минуты с точностью до уровня атомов.

В прошлом году DeepMind опубликовала в открытой базе данных структуры белков 20 видов, включая почти все 20 000 белков, экспрессируемых людьми. Теперь он завершил работу и выпустил предсказанные структуры для более чем 200 млн белков.

Как применяют технологию?

Исследователи уже используют плоды труда AlphaFold. Согласно The Guardian, программа позволила ученым окончательно охарактеризовать ключевой белок малярийного паразита, который не поддавался рентгеновской кристаллографии. В конечном итоге это улучшит вакцину против болезни.

Трехмерное изображение белка малярии. Изображение предоставлено Deepmind

Исследователь медоносных пчел Вильде Лейпарт из Норвежского университета естественных наук использовал AlphaFold для выявления структуры вителлогенина. Это репродуктивный и иммунный белок, который вырабатывается всеми яйцекладущими животными. Открытие поможет разработать новые способы защиты, например, медоносных пчел и рыбы от болезней. Это важно, ведь эти животные важны для пропитания человечества.

Программа также информирует о поиске новых фармацевтических препаратов, заявила Розана Капеллер, генеральный директор ROME Therapeutics, в заявлении DeepMind. «Скорость и точность AlphaFold ускоряют процесс разработки лекарств. Мы только начинаем осознавать его влияние на развитие фармацевтики», — заключила она.

Также модели AlphaFold также используются учеными из Центра инноваций в области ферментов Портсмутского университета для выявления ферментов из природного мира, которые можно настроить для переработки пластмасс. 

Читать далее:

Скоро на Землю обрушится солнечная буря: материал летит со скоростью 800 км/с

Ученые сняли на видео странное существо с щупальцами, которое приняли за цветок

Россия покидает МКС: что теперь будет и почему обслуживание станции под угрозой