Все 47 участников проекта «пангеном» родились в разных частях Земли. Благодаря этому ученые в разы увеличили разнообразие геномов, представленных в последовательности, по сравнению с предыдущим проектом. Первая последовательность генома человека была выпущена в 2003 году, и она была неполной. Только в 2022 году пробелы закрыли. И, если этот первый геном человека представляет собой простую линейную цепочку генетического кода, то новый пангеном — серию ветвящихся путей.
Конечная цель Консорциума по изучению пангенома человека, состоит в том, чтобы секвенировать не менее 350 человек из разных популяций по всему миру. Хотя 99,9% генома одинаковы у разных людей, в этих последних 0,1% и кроется самое интересное — различия между нами.
Геном как большой справочник
Первая полная последовательность человека была завершена в 2003 году в рамках проекта «Геном человека» и основана на ДНК одного человека. Позже были добавлены кусочки примерно 20 других людей, но 70% последовательностей, которые ученые используют для оценки генетической изменчивости, по-прежнему — от одного человека.
Генетики используют эталонный геном в качестве руководства при секвенировании фрагментов генетического кода людей. Биологи сопоставляют с ним недавно расшифрованные фрагменты ДНК, чтобы выяснить, как они вписываются в геном в целом. Также ученые берут эталонный геном в качестве стандарта для точного определения генетических вариаций — различных версий генов, которые отличаются от эталона — которые могут быть связаны с состоянием здоровья.
Но в случае генома одного человека возможности ученых ограничены.
Теперь в рамках первого проекта пангенома исследователи удвоили количество больших вариантов генома ( структурных вариантов), доведя их число до 18 000. Это места в геноме, где большие фрагменты были удалены, вставлены или перестроены. Исследователи также добавили 119 млн новых пар оснований, то есть парных «букв», составляющих последовательность ДНК, и 1 115 новых мутаций дупликации генов к предыдущей версии генома человека.
Пангеном поможет ученым лучше понять сложные состояния, в которых гены играют важную роль, такие как аутизм, шизофрения, иммунные нарушения и ишемическая болезнь сердца , заявили на пресс-конференции исследователи. Например, известно, что ген липопротеина А является одним из самых больших факторов риска ишемической болезни сердца у афроамериканцев. Но связанные с этим специфические генетические изменения сложны и плохо изучены. Теперь с помощью пангенома ученых могут более тщательно сравнивать различия между людьми с сердечными заболеваниями и без них. Это поможет уточнить риск сердечных заболеваний у людей в зависимости от того, какие варианты гена они несут.
Разнообразие и понимание
В текущем проекте пангенома использовались данные участников проекта «1000 геномов». Это была первая попытка секвенировать геномы большого количества людей со всего мира. Субъекты согласились на то, чтобы их генетические последовательности анонимизировали и включили в общедоступные базы данных.
новом исследовании также использовали передовую технологию секвенирования, известную как «длинное секвенирование», в отличие от ранее использовавшегося короткого.
Как работает короткое секвенирование?
Исследователи считывают небольшие сегменты ДНК, а затем сшивают их вместе в единое целое. Этот тип секвенирования выявляет приличное количество генетических вариаций. Проблема в том, что между каждым фрагментом ДНК может быть плохое перекрытие. С другой стороны, секвенирование с длинным чтением захватывает большие сегменты ДНК одновременно.
При этом, котороткое секвенирование стоит около 500 долларов, а длинное, по-прежнему, слишком дорого — около 10 000 долларов за геном. Однако с голами цена снижается, и команда специалистов надеется секвенировать следующие партии геномов за половину этой стоимости или даже меньше.
Что дальше?
Сейчас исследователи работают над набором новых участников, чтобы заполнить пробелы в разнообразии пангенома. Поскольку генетическая информация является конфиденциальной, а обмен такими данными в разных странах регулируются своими правилами, это деликатная работа. Важные вопросы, которые учитывают биологи: конфиденциальность, информированное согласие и возможность дискриминации на основе генетической информации.
Исследователи уже открывают новые генетические процессы с помощью проекта пангенома. В двух статьях, опубликованных в журнале Nature, исследователи рассмотрели повторяющиеся сегменты генома. Традиционно их было трудно изучать:
секвенирование с помощью технологии быстрого считывания затрудняет понимание того, как они сочетаются друг с другом. А технология длительного чтения позволяет одновременно считывать длинные фрагменты этих повторяющихся последовательностей.
Исследования показали, что в одном типе повторяющихся последовательностей, известных как сегментарные дупликации, существует большее, чем ожидалось, количество вариаций. Потенциально это — механизм долгосрочной эволюции новых функций генов. Однако в другом типе повторяющихся последовательностей, отвечающих за создание клеточных машин, создающих новые белки, геном остается удивительно стабильным. Пангеном позволил исследователям обнаружить потенциальный механизм того, как эти ключевые сегменты ДНК остаются неизменными с течением времени.
«Это только начало. Нас ждет много новой биологии», — заключают ученые.
На обложке: новый человеческий эталонный пангеном включает в себя данные ДНК от 47 человек. Изображение предоставлено Дэррил Лежа, NHGRI