Обычные алгоритмы расшифровки ДНК опираются на идею, что большое количество копий нити ДНК можно разбить на множество легко считываемых мелких фрагментов, которые при этом частично пересекаются друг с другом. Но в таком случае для расшифровки надо много вычислительных ресурсов.
Авторы новой работы решили переделать алгоритм, чтобы он не требовал таких высоких мощностей при вычислении. Они создали математическую теорию, с помощью которой геном можно закодировать в виде набора из часто встречающихся последовательностей из нескольких букв-нуклеотидов, а не одиночных звеньев.
С помощью нового подхода можно сделать процесс расшифровки быстрее и склеить частично совпадающие фрагменты ДНК. В результате авторы использовали меньше компьютерной памяти для аналогичных вычислений.
Наш подход работает, даже если в исходном материале содержится до 4% ошибок. Вкупе с удешевлением машин для секвенирования это открывает дорогу для демократизации генетического анализа.
Бонни Бергер, профессор Массачусетского технологического института и один из авторов исследования.
Во время эксперимента авторы попробовали расшифровать ДНК человека. Процесс сборки человеческого генома занял всего 10 минут и потребовал около 10 гигабайтов оперативной памяти,
Читать далее:
Физики приблизились к обнаружению пятой силы во время создания идеальных кристаллов
Самую детальную модель Вселенной опубликовали онлайн. Ее может изучить любой желающий
Литий-серная батарея с сахаром вмещает в 5 раз больше энергии