Наука 11 июля 2024

Нейросети ускорили поиск подходящих для лекарств молекул в 2000 раз

Далее

Ученые из группы «Глубокое обучение в науках о жизни» Института искусственного интеллекта AIRI разработали метод, который позволит симулировать поведение органических молекул в 2 тысячи раз быстрее, чем при традиционном подходе, основанном на решении уравнений квантовой физики. Об этом сообщает AIRI в своем пресс-релизе.

Компьютерное моделирование является одним из ключевых инструментов современной фармацевтической отрасли, поскольку оно позволяет предсказать свойства молекулы без ее предварительного синтеза. Зачастую используются методы на основе теории функционала плотности (DFT), которые позволяют предсказывать энергии молекулярных конформаций с высокой точностью. Однако у DFT-симуляторов есть один существенный минус — они требуют значительного времени на вычисление.

Этого недостатка лишены нейросети, которые, исходя из межатомных взаимодействий молекул, дают возможность прогнозировать полезные свойства молекулярных структур без применения физических симуляторов, а значит, не требуют значительных вычислительных мощностей.

Один из нейросетевых способов компьютерного моделирования опирается на использование нейросетевых потенциалов (NNP) для предсказания энергии молекулярной конформации. Команда исследователей из AIRI, ФИЦ ИУ РАН, МФТИ и Университета Констрактор в Бремене доказала, что оптимизация с использованием NNP примерно в 2 тысячи раз быстрее, чем оптимизация с помощью DFT-симулятора.

Вместе с тем, учёные выяснили, что нейронные потенциалы, обученные на обычных открытых наборах данных, нельзя использовать для задач оптимизации без дообучения. Чтобы получить качество, сравнимое с физическими симуляторами, необходимо собрать и посчитать энергию для примерно полумиллиона дополнительных конформаций.

С целью уменьшить количество необходимых дополнительных данных при обучении нейронного потенциала, исследователи предложили новый фреймворк под названием GOLF (Gradual Optimization Learning Framework). В его основе лежит активное обучение, в котором, помимо DFT-симулятора, используется суррогатный симулятор на базе простой эмпирической модели молекулярных силовых полей. Эксперименты показали, что нейронный потенциал, обученный с помощью GOLF, имеет такую же точность при в 50 раз меньшем числе дополнительных конформаций. 

Помимо этого, научная группа активно занимается развитием других инструментов, полезных для фармацевтической отрасли. 

Обложка — downloaded from Freepik.