ИИ использует данные, недоступные другим, чтобы ускорить открытие лекарств

Исследователи разработали систему обучения, которая использует большие объемы немаркированных данных — они недоступны другим моделям.

Исследователи из Инженерного колледжа Университета Карнеги-Меллона решили использовать использовать большой объем немаркированных молекул для построения моделей машинного обучения. Она делает предсказания лучше другим моделей. 

Исследователи создали самообучающийся ИИ MolCLR с помощью графовых нейронных сетей (GNNS). 

MolCLR значительно повышает производительность моделей машинного обучения, так как использует  примерно 10 млн немаркированных данных о молекулах.

Амир Барати Фаримани, доцент кафедры машиностроения.

Чтобы объяснить как работают маркированные и немаркированные данные, представьте фотографии собак и кошек. В одном наборе каждое животное помечено названием своего вида. В другом наборе изображения не сопровождаются надписями.

Для человека разница между этими двумя типами животных может быть очевидной. Но для модели машинного обучения нет. Это значит, что немаркированные данные не всегда могут правильно обучить модель. Если применить эту аналогию к миллионам непомеченных молекул, на идентификацию которых вручную у людей могут уйти десятилетия, становится понятно, что нужно решать проблему иначе. 

Исследовательская группа учила свою структуру  MolCLR тому, как использовать немаркированные данные, — нужно сравнить положительные и отрицательные пары из расширенного графа молекул. Графики, преобразованные из одной и той же молекулы, считаются положительной парой, а графики, преобразованные из разных молекул, — это отрицательная пара. Поэтому похожие молекулы остаются близко друг к другу, а остальные отодвигаются далеко.

Во время тестов модель машинного обучения работала эффективнее других и могла различать, какие химические вещества представляют наиболее серьезную угрозу для здоровья человека.

Читать далее:

Самое большое генеалогическое древо человечества показало историю нашего вида

Опасность бесплатных VPN. Почему их нельзя скачивать и как защитить себя?

Почему Ганимед — самый странный спутник и есть ли на нем жизнь

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Живые башни из червей: посмотрите на «суперорганизм», который нашли в саду
Наука
Имплантат сетчатки из нанопроводов восстановил зрение у мышей
Наука
На российских сайтах хотят запретить авторизацию через почту Google
Новости
ИИ против айтишников: как новые инструменты меняют ИТ-бизнес
Мнения
Оказалось, Apple Watch «обманывают» в подсчете калорий
Новости
Китай впервые проверил квантовую связь QSDC на борту многоразовой ракеты
Наука
В Москве пройдет форум MOSТИМ 2025 — обсудят цифровизацию в строительстве и выберут лучших в BIM
Новости
Россиянам могут заблокировать входящие звонки из-за рубежа
Новости
Страдающее «лицо» появилось на Солнце: ученые фиксируют поток частиц в сторону Земли
Космос
Маск и Трамп начали войну в соцсетях: что произошло и какие будут последствия
Кейсы
В Нижнем Новгороде создали «умный» материал для 3D-печати человеческих тканей
Наука
ИИ против супербактерий: в ИТМО создали платформу для поиска новых лекарств
Новости
Парк промышленных роботов в России вырос на 62% за один год
Новости
Геофизики объяснили загадочное ускорение сейсмических волн в недрах Земли
Наука
Семь российских вузов разделят 4,7 млрд рублей на исследования в области ИИ
Иннополис
Найден способ изучать квантовые состояния, которые десятилетиями не получалось поймать
Наука
Каталог кейсов применения квантовых технологий представили в России
Новости
Ozempic и мужское здоровье: как препарат влияет на либидо и восприятие размера пениса
Наука
Землю 2.0 нашли рядом со звездой, похожей на Солнце
Космос
Рыбу «Судного дня» случайно нашли в на пляже: почему ее опасаются
Наука