Новости 29 июля 2022

В единой базе впервые собрали почти все известные белки, их 200 млн

Далее

Опубликована база данных AlphaFold Protein Structure от DeepMind. В нее входит более 200 млн белков.

В 2021 году компания Alphabet DeepMind выпустила базу данных с открытым исходным кодом, в которой были 3D-структуры сотен тысяч белков. В частности, 20 тыс. известных белков, которые есть в человеческом организме. 

Теперь эту базу данных расширили до 200 млн. В нее входят почти все известные науке белки.

Сегодня ученым по прежнему сложно рассчитать точную структуру белка на основе аминокислот, из которых он состоит. Обычно для этого нужно затратить огромное количество вычислительных мощностей и времени. Это назвали проблемой сворачивания белка. Поэтому прогресс в этой области идет относительно медленно. 

Теперь компания Alphabet натренировала мощный ИИ DeepMind. Он был обучен на 100 000 известных белковых структура. Такая система, по словам разработчиков, может предсказывать структуры миллионов других белков. На определение каждого уходили минуты или секунды, а не месяцы или годы.

Теперь DeepMind выпустила новое масштабное обновление базы данных. Теперь в нее входит около 214 млн структур из миллиона видов. Это почти все белки, известные в настоящее время науке. Отмечается, что база данных поможет проводить исследования в области лечения заболеваний, создания вакцин, а также поможет решить проблему устойчивости к антибиотикам.

Всю базу, которая состоит из 25 терабайт данных, можно загрузить из Google Cloud.

Читать далее:

Ученые сняли на видео странное существо с щупальцами, которое приняли за цветок

Сверхзвуковой самолет будет летать со скоростью 2 000 км/ч и пересечет океан за 3,5 часа

Создан квантовый компьютер, который «вышел за пределы двоичной системы»