ИИ использует данные, недоступные другим, чтобы ускорить открытие лекарств

Исследователи разработали систему обучения, которая использует большие объемы немаркированных данных — они недоступны другим моделям.

Исследователи из Инженерного колледжа Университета Карнеги-Меллона решили использовать использовать большой объем немаркированных молекул для построения моделей машинного обучения. Она делает предсказания лучше другим моделей. 

Исследователи создали самообучающийся ИИ MolCLR с помощью графовых нейронных сетей (GNNS). 

MolCLR значительно повышает производительность моделей машинного обучения, так как использует  примерно 10 млн немаркированных данных о молекулах.

Амир Барати Фаримани, доцент кафедры машиностроения.

Чтобы объяснить как работают маркированные и немаркированные данные, представьте фотографии собак и кошек. В одном наборе каждое животное помечено названием своего вида. В другом наборе изображения не сопровождаются надписями.

Для человека разница между этими двумя типами животных может быть очевидной. Но для модели машинного обучения нет. Это значит, что немаркированные данные не всегда могут правильно обучить модель. Если применить эту аналогию к миллионам непомеченных молекул, на идентификацию которых вручную у людей могут уйти десятилетия, становится понятно, что нужно решать проблему иначе. 

Исследовательская группа учила свою структуру  MolCLR тому, как использовать немаркированные данные, — нужно сравнить положительные и отрицательные пары из расширенного графа молекул. Графики, преобразованные из одной и той же молекулы, считаются положительной парой, а графики, преобразованные из разных молекул, — это отрицательная пара. Поэтому похожие молекулы остаются близко друг к другу, а остальные отодвигаются далеко.

Во время тестов модель машинного обучения работала эффективнее других и могла различать, какие химические вещества представляют наиболее серьезную угрозу для здоровья человека.

Читать далее:

Самое большое генеалогическое древо человечества показало историю нашего вида

Опасность бесплатных VPN. Почему их нельзя скачивать и как защитить себя?

Почему Ганимед — самый странный спутник и есть ли на нем жизнь

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Юпитер оказался не таким, как считали ученые: открытие опровергает гипотезу о гиганте
Космос
Физики придумали, как найти новые измерения в пространстве
Наука
Посмотрите на первое фото кометы C/2024 G3 в России: она прилетает раз в 160 000 лет
Космос
Ученые нашли необычные частицы: их поведение невозможно объяснить обычной физикой
Наука
Байден запретит поставки ИИ-чипов в Россию: что ответила NVIDIA
Новости
300 млрд киловатт-часов: Китай строит крупнейшую в мире гидроэлектростанцию
Новости
Парниковые газы предложили хранить в стенах домов для борьбы с изменением климата
Наука
Ученые разгадали тайну, как древние птерозавры поднялись в воздух
Наука
Эксперимент показал, что фотоны света могут вести себя как частицы темной материи
Наука
ИИ создал крупнейшую базу данных фотографий северного сияния
Наука
Молекулы РНК превратили в «фонарики», чтобы отслеживать их работу в клетке
Наука
Европейский зонд показал северный полюс Меркурия в рекордных деталях
Космос
Посмотрите, как изменится внешний вид людей через 30 лет  
Наука
Посмотрите на первые фото Tesla Model Y без камуфляжа  
Новости
«Тостер» для смартфона обновляет зарядку гаджета за секунды
Новости
Гаджет, который научился читать мысли человека, показали на CES 2025
Новости
Эта камера будет снимать на Луне: Nikon представила прототип на CES 2025  
Новости
Ярчайший гамма-всплеск в истории связали с теорией струн и темной материей  
Новости
Наука в фокусе: кто и зачем делает научно-популярные видеоблоги в России
Кейсы
Telegram раскрыл данные о 2000 пользователях в после ареста Дурова
Новости