ИИ использует данные, недоступные другим, чтобы ускорить открытие лекарств

Исследователи разработали систему обучения, которая использует большие объемы немаркированных данных — они недоступны другим моделям.

Исследователи из Инженерного колледжа Университета Карнеги-Меллона решили использовать использовать большой объем немаркированных молекул для построения моделей машинного обучения. Она делает предсказания лучше другим моделей. 

Исследователи создали самообучающийся ИИ MolCLR с помощью графовых нейронных сетей (GNNS). 

MolCLR значительно повышает производительность моделей машинного обучения, так как использует  примерно 10 млн немаркированных данных о молекулах.

Амир Барати Фаримани, доцент кафедры машиностроения.

Чтобы объяснить как работают маркированные и немаркированные данные, представьте фотографии собак и кошек. В одном наборе каждое животное помечено названием своего вида. В другом наборе изображения не сопровождаются надписями.

Для человека разница между этими двумя типами животных может быть очевидной. Но для модели машинного обучения нет. Это значит, что немаркированные данные не всегда могут правильно обучить модель. Если применить эту аналогию к миллионам непомеченных молекул, на идентификацию которых вручную у людей могут уйти десятилетия, становится понятно, что нужно решать проблему иначе. 

Исследовательская группа учила свою структуру  MolCLR тому, как использовать немаркированные данные, — нужно сравнить положительные и отрицательные пары из расширенного графа молекул. Графики, преобразованные из одной и той же молекулы, считаются положительной парой, а графики, преобразованные из разных молекул, — это отрицательная пара. Поэтому похожие молекулы остаются близко друг к другу, а остальные отодвигаются далеко.

Во время тестов модель машинного обучения работала эффективнее других и могла различать, какие химические вещества представляют наиболее серьезную угрозу для здоровья человека.

Читать далее:

Самое большое генеалогическое древо человечества показало историю нашего вида

Опасность бесплатных VPN. Почему их нельзя скачивать и как защитить себя?

Почему Ганимед — самый странный спутник и есть ли на нем жизнь

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Квантовые алгоритмы: путь к вычислительной революции
Мнения
Китайская Alibaba инвестирует 380 млрд юаней в искусственный интеллект
Новости
Галактику-канибала обнаружили в 88 млн световых годах от Земли
Космос
Посмотрите, как крутится «мельница» солнечных батарей на МКС
Космос
Китайские инженеры создали небольшого робота, который движется как гепард
Новости
CRISPR помог избавиться от лишней хромосомы в клетках с синдромом Дауна
Наука
Суперкомпьютер НАСА показал странную спираль на краю Солнечной системы
Космос
Основные принципы Data Governance: как правильно управлять данными компании
Мнения
Подросток установил шесть рекордов по математике за день: в чем секрет
Новости
Эту звезду искали 40 лет: она состоит из очень необычной материи
Новости
Найдена связь между взрывом сверхновой и эволюции жизни на Земле
Новости
«Случайность маловероятна»: в Балтике поврежден интернет-кабель
Новости
SpaceX запустит телескоп для защиты Земли: как он будет работать
Новости
Ученые создают датчики, похожие на усики комаров, для обнаружения землетрясений
Наука
ИИ диагностирует диабет, ВИЧ и COVID по одному образцу крови
Наука
Китайские генетики создали «рис для укрепления здоровья сердечной системы»
Наука
Тяжелое генетическое заболевание вылечили до рождения в утробе матери
Наука
Высокоскоростная съемка показала, что происходит с каплей при падении в бассейн
Наука
В России создали ИИ-платформу для ускоренной разработки лекарств
Иннополис
Физики побили рекорд Китая по удержанию плазмы в искусственном Солнце
Наука