Разрабатывая модели машинного обучения, которые могут просматривать информацию о белках, собранную из баз данных генома, ученые нашли относительно простые правила проектирования для создания искусственных заменителей. Когда команда сконструировала искусственные белки в лаборатории, они обнаружили, что они соперничали с теми, которые встречаются в природе.
Мы все задались вопросом, как простой процесс, такой как эволюция, может привести к такому высокопроизводительному материалу, как белок. Мы обнаружили, что данные генома содержат огромное количество информации об основных правилах структуры и функционирования белка, и теперь мы смогли создать правила природы, чтобы самим создавать белки.
Рама Ранганатан, профессор на кафедре биохимии и молекулярной биологии, Pritzker Molecular Engineering
Белки состоят из сотен или тысяч аминокислот, и эти аминокислотные последовательности определяют структуру и функцию белка. Но понять, как создать эти последовательности для создания новых белков, было непросто. Прошлая работа привела к методам, которые могут определять структуру, но функция была более неуловимой.
За последние 15 лет Ранганатан и его сотрудники осознали, что базы данных генома, которые растут в геометрической прогрессии, содержат огромное количество информации об основных правилах структуры и функционирования белка. Его группа разработала математические модели на основе этих данных, а затем начала использовать методы машинного обучения, чтобы раскрыть новую информацию об основных правилах проектирования белков.
Для этого исследования они изучили семейство метаболических ферментов хоризмат-мутазы, тип белка, который важен для жизни многих бактерий, грибов и растений. Используя модели машинного обучения, исследователи смогли выявить простые правила проектирования этих белков.
Модель показывает, что только сохранение в положениях аминокислот и корреляции в эволюции пар аминокислот достаточно для предсказания новых искусственных последовательностей, которые будут обладать свойствами семейства белков.
Обычно мы предполагаем, что для того, чтобы что-то построить, нужно сначала глубоко понять, как это работает. Но если у вас достаточно примеров данных, вы можете использовать методы глубокого обучения, чтобы выучить правила проектирования, даже если вы понимаете, как он работает или почему он построен таким образом.
Рама Ранганатан, профессор на кафедре биохимии и молекулярной биологии, Pritzker Molecular Engineering
Затем он и его сотрудники создали синтетические гены для кодирования белков, клонировали их в бактерии и наблюдали, как бактерии затем производили синтетические белки, используя свои обычные клеточные механизмы. Они обнаружили, что искусственные белки имеют ту же каталитическую функцию, что и природные белки хоризмат-мутазы.
Поскольку правила проектирования настолько просты, количество искусственных белков, которые потенциально могут создать исследователи, чрезвычайно велико.
Хотя искусственный интеллект раскрыл правила проектирования, Ранганатан и его сотрудники все еще не до конца понимают, почему модели работают. Ученые будут работать, чтобы понять, как модели пришли к такому состоянию.
В то же время они также надеются использовать эту платформу для разработки белков, которые могут решать насущные социальные проблемы, такие как изменение климата. Ранганатан и доц. Профессор Эндрю Фергюсон основал компанию Evozyne, которая будет коммерциализировать эту технологию, применяя ее в энергетике, окружающей среде, катализе и сельском хозяйстве.
Читать также
Посмотрите на 3D-карту Вселенной: ее составляли 20 лет и она уже удивила ученых
Выяснилось, что коронавирус не дает клеткам распознавать его
В Омской области археологи нашли кости и оружие, которым 12 тысяч лет