Команда из Политехнического института Ренсселера доказала, что программное обеспечение для машинного обучения и распознавания изображений подойдет для быстрой и точной идентификации сахарных цепей — в частности четырех синтетических гепарансульфатов. Электрические сигналы генерируются во время прохода через крошечное отверстие в кристаллической пластине. Результаты публикует журнал Proceedings of the National Academy of Sciences.
Гликозаминогликаны — сложный репертуар последовательностей, как произведение Шекспира — сложный набор букв. Для их написания нужен эксперт, как и для чтения. Мы обучили машину быстро читать эквивалент слов из четырех букв, таких как ababab или bcbcbc. Это простые последовательности, которые не имеют никакого значения. Однако они показали, что машину можно научить читать. Если мы расширим и разработаем эту технологию, у нее есть потенциал для секвенирования гликанов или даже белков в реальном времени, не затрачивая на это годы.
Роберт Линхардт, ведущий исследователь и профессор. химии и химической биологии в Политехническом институте Ренсселера
Коммерческие устройства для секвенирования нанопор используются для секвенирования ДНК. Она состоит из четырех единиц нуклеиновой кислоты, известных под буквами A, C, G и T, соединенных вместе в бесконечном разнообразии конфигураций. Устройство использует ионный ток, проходящий через отверстие в мембране шириной всего несколько миллиардных долей метра. Нити ДНК помещаются с одной стороны отверстия и протягиваются сквозь нее с током. Каждая нуклеиновая кислота в некоторой степени блокирует отверстие, когда оно проходит, нарушая ток и давая определенный сигнал, связанный с этой нуклеиновой кислотой. Устройства, которые сейчас используются для полевых исследований, являются лишь одним из нескольких относительно быстрых и автоматизированных методов секвенирования ДНК.
Гликозаминогликаны (GAG) представляют собой структурно сложный класс гликанов. Это незаменимые сахара, присутствующие в живых организмах. Они выполняют множество функций в клеточном росте и передаче сигналов, антикоагуляции и заживлении ран. Сегодня гликозаминогликаны извлекаются из забитых животных, используются в качестве лекарств и нутрицевтиков.
Подобно ДНК, их можно подразделить на составляющие их дисахаридные сахарные единицы. Но в то время как ДНК состоит только из четырех букв в линейной строке, у гликанов — десятки основных единиц. У некоторых из них есть присоединенные сульфатные, кислотные и амидные группы. Например, даже у относительно небольшой встречающейся в природе молекулы гепарансульфата из шести сахарных единиц может быть 32 768 возможных последовательностей. Секвенирование гликанов остается обременительным, полагаясь на кропотливую лабораторную работу и сложный анализ с использованием таких методов, как жидкостная хроматография и тандемная масс-спектрометрия и спектроскопия ядерного магнитного резонанса.
Ученые разработали синтетический вариант обычного разжижающего кровь гепарина. Он секвенирует GAG, чтобы понять встречающиеся в природе формы и разработать его синтетические варианты.
Команда ученых пропустила каждый гепарансульфат через нанопоры и построила график, отображающий выходное напряжение устройства в зависимости от времени. Каждый из четырех вариантов проходил через устройство более 2 000 раз, что увеличивало статистическую вероятность точного считывания с учетом элементарной конструкции экспериментальной нанопоры.
Устройство секвенировало простейший гепарансульфат в реальном времени и создавало узор, который ученые легко распознают сразу для каждого из четырех образцов. Сразу видно, что они разные.
Чтобы обеспечить объективный анализ, команда загрузила результаты в бесплатное программное обеспечение для машинного обучения и распознавания изображений. Они использовали глубокую нейронную сеть Google, обучая программное обеспечение различать четыре различных паттерна и идентифицировать каждый вариант гепарансульфата. Наиболее успешная модель дала анализ с точностью почти 97%.
Информационное содержание последовательности GAG может значительно превосходить такое же количество ДНК или РНК. Это значит, что способность быстро их считывать открывает новое окно понимания сложной биохимии жизни. Доказательство концепции исследования связывает инновационные методы нанообнаружения с современными инструментами машинного обучения.
Уменьшение скорости, с которой гликозаминогликаны проходят через нанопоры, повысит точность, и устройство можно обучить на более сложных последовательностях. Однако ученые уже сократили необходимое для секвенирования ключевых молекул GAG время с нескольких лет до минут.
Читать далее
Физики создали аналог черной дыры и подтвердили теорию Хокинга. К чему это приведет?
Алгоритм обнаружил новый таинственный слой внутри Земли
Из-за Солнца атмосфера Земли потеряет весь свободный кислород
Гликозаминогликаны, мукополисахариды — углеводная часть протеогликанов, полисахариды, в состав которых входят аминосахара-гексозамины. В организме гликозаминогликаны ковалентно связаны с белковой частью протеогликанов и в свободном виде не встречаются.
ЯМР-спектроскопия — спектроскопический метод исследования химических объектов, использующий явление ядерного магнитного резонанса. Явление ЯМР открыли в 1946 году американские физики Ф. Блох и Е.Персел.
Жидкостная хроматография и тандемной масс-спектрометрия — широко распространённый метод химического анализа сочетающий в себе физическое разделение жидкостной хроматографии с масс-спектрометрией.