Новости 5 марта 2022

ИИ использует данные, недоступные другим, чтобы ускорить открытие лекарств

Далее

Исследователи разработали систему обучения, которая использует большие объемы немаркированных данных — они недоступны другим моделям.

Исследователи из Инженерного колледжа Университета Карнеги-Меллона решили использовать использовать большой объем немаркированных молекул для построения моделей машинного обучения. Она делает предсказания лучше другим моделей. 

Исследователи создали самообучающийся ИИ MolCLR с помощью графовых нейронных сетей (GNNS). 

MolCLR значительно повышает производительность моделей машинного обучения, так как использует  примерно 10 млн немаркированных данных о молекулах.

Амир Барати Фаримани, доцент кафедры машиностроения.

Чтобы объяснить как работают маркированные и немаркированные данные, представьте фотографии собак и кошек. В одном наборе каждое животное помечено названием своего вида. В другом наборе изображения не сопровождаются надписями.

Для человека разница между этими двумя типами животных может быть очевидной. Но для модели машинного обучения нет. Это значит, что немаркированные данные не всегда могут правильно обучить модель. Если применить эту аналогию к миллионам непомеченных молекул, на идентификацию которых вручную у людей могут уйти десятилетия, становится понятно, что нужно решать проблему иначе. 

Исследовательская группа учила свою структуру  MolCLR тому, как использовать немаркированные данные, — нужно сравнить положительные и отрицательные пары из расширенного графа молекул. Графики, преобразованные из одной и той же молекулы, считаются положительной парой, а графики, преобразованные из разных молекул, — это отрицательная пара. Поэтому похожие молекулы остаются близко друг к другу, а остальные отодвигаются далеко.

Во время тестов модель машинного обучения работала эффективнее других и могла различать, какие химические вещества представляют наиболее серьезную угрозу для здоровья человека.

Читать далее:

Самое большое генеалогическое древо человечества показало историю нашего вида

Опасность бесплатных VPN. Почему их нельзя скачивать и как защитить себя?

Почему Ганимед — самый странный спутник и есть ли на нем жизнь