Машинное обучение используется для майнинга существующих биобанков и создания фрагментов геномов человека, которые не принадлежат реальным людям. При этом у них характеристики настоящих. Результаты исследования публикует журнал PLOS Genetics.
Благодаря новым алгоритмам и достижениям в области компьютерных технологий машины теперь могут изучать сложные модели и даже генерировать высококачественные синтетические данные, такие как фотореалистичные изображения или даже резюме воображаемых людей. В исследовании, недавно опубликованном в международном журнале PLOS Genetics, машинное обучение используется для майнинга существующих биобанков и создания фрагментов геномов человека, которые не принадлежат реальным людям, но имеют характеристики настоящих геномов.
«Существующие геномные базы данных — это бесценный ресурс для биомедицинских исследований. Однако они либо недоступны для общественности, либо защищены долгими и изнурительными процедурами подачи заявок из-за серьезных этических проблем. Это создает серьезный научный барьер для исследователей. Искусственные геномы помогут нам преодолеть эту проблему», — объясняет Бурак Ельмен, первый автор исследования и младший научный сотрудник современной популяционной генетики Тартуского университета.
Многодисциплинарная команда провела несколько анализов, чтобы оценить качество сгенерированных геномов по сравнению с реальными. «Удивительно, но эти геномы, возникающие из случайного шума, имитируют сложности, которые мы можем наблюдать в реальных человеческих популяциях. По большинству свойств они неотличимы от других геномов из биобанка, который мы использовали для обучения нашего алгоритма, за исключением одной детали: они действительно не принадлежат к какому-либо донору», — подчеркивает д-р Лука Пагани, один из ведущих авторов исследования и сотрудник Mobilitas Pluss.
Читать далее
Посмотрите на изображение Марса из 8 триллионов пикселей
Аборты и наука: что будет с детьми, которых родят
Ученые объяснили, почему растение вольфия является самым быстрорастущим