Наука 25 мая 2020

Биоинформатики из Петербурга создали новый сборщик для расшифровки геномов вирусов

Далее

Ученые из Петербурга разработали metaviralSPAdes — новый сборщик, позволяющий найти и собрать геном вируса среди множества других последовательностей. Исследование сотрудников из Центра алгоритмической биотехнологии СПбГУ Биоинформатики Центра алгоритмической биотехнологии СПбГУ и Калифорнийского университета в Сан-Диего есть в распоряжении «Хайтека». Научная статья опубликована в журнале Bioinformatics.

Когда человечество сталкивается с новым вирусом, биологи первым делом принимаются за расшифровку его генома — это необходимое условие для дальнейшей диагностики заболевания и разработки вакцины. Однако, если секвенирование нужно провести во время вспышки нового патогена, возникает проблема. Например, в слюне пациента с COVID-19, которая использовалась для самой первой расшифровки коронавируса SARS-CoV-2, содержались геномы многих других, в большинстве случаев безвредных вирусов. Не говоря уже о сотнях бактерий, которые живут во рту человека и затрудняют поиск вирусных последовательностей.

Этот пример показывает, как важно уметь решать гораздо более сложную вычислительную задачу, чем расшифровка одного генома, — собирать метагеномы, наборы из сотен различных геномов микроорганизмов, живущих в одной среде. Сложность заключается в том, что в результате такой работы можно получить тысячи последовательностей, среди которых будут фрагменты генетического кода как вирусов, так и бактерий, и какие именно данные относятся к нужному патогену, понять совсем непросто.

К тому же перед учеными неизбежно встанет другая задача — секвенирование метавирома — суть которой заключается в том, чтобы идентифицировать именно вирусные последовательности, скрытые среди гораздо более длинных бактериальных фрагментов. Затем биоинформатикам предстоит по кусочкам собрать полный геном вируса, ставшего виновником вспышки заболевания.

Группа российских и американских ученых из Санкт-Петербургского государственного университета и Калифорнийского университета в Сан-Диего разработала ассемблер metaviralSPAdes, который превращает анализ результатов секвенирования метавирома в простую задачу.

Сейчас биологам приходится анализировать небольшие фрагменты генома, поэтому сборка генома мало чем отличается от сборки пазла из миллиона фрагментов. Часто эту задачу рассматривают как одну из самых сложных алгоритмических проблем в биоинформатике. При этом другой ассемблер российских ученых — SPAdes — уже был применен в 9 тыс. исследований. С его помощью ученые анализировали патогены, вызвавшие вспышку Ближневосточного респираторного синдрома (MERS) в Саудовской Аравии, Эболы в Конго, гонореи в Англии, менингита в Гане, лихорадки денге на Суматре и десятки других вспышек, которые произошли за последние восемь лет с момента создания SPAdes.

После этого команда этих разработчиков создала metaSPAdes, который, в свою очередь, стал ведущим метагеномным сборщиком. С его помощью извлекать вирусные последовательности из огромного количества данных стало легче, однако сборщик нового поколения metaviralSPAdes способен не только находить фрагменты вирусных геномов, но еще и собирать из них готовый «пазл» — геном патогена.


Читайте также:

В Сибири разработали имплантат для тазобедренного сустава. Его установка не требует диагностики!

Ученые нашли доказательства существования долгоживущих озер на Марсе

Появилась новая противораковая вакцина на основе микрокапсул