ИИ использует данные, недоступные другим, чтобы ускорить открытие лекарств

Исследователи разработали систему обучения, которая использует большие объемы немаркированных данных — они недоступны другим моделям.

Исследователи из Инженерного колледжа Университета Карнеги-Меллона решили использовать использовать большой объем немаркированных молекул для построения моделей машинного обучения. Она делает предсказания лучше другим моделей. 

Исследователи создали самообучающийся ИИ MolCLR с помощью графовых нейронных сетей (GNNS). 

MolCLR значительно повышает производительность моделей машинного обучения, так как использует  примерно 10 млн немаркированных данных о молекулах.

Амир Барати Фаримани, доцент кафедры машиностроения.

Чтобы объяснить как работают маркированные и немаркированные данные, представьте фотографии собак и кошек. В одном наборе каждое животное помечено названием своего вида. В другом наборе изображения не сопровождаются надписями.

Для человека разница между этими двумя типами животных может быть очевидной. Но для модели машинного обучения нет. Это значит, что немаркированные данные не всегда могут правильно обучить модель. Если применить эту аналогию к миллионам непомеченных молекул, на идентификацию которых вручную у людей могут уйти десятилетия, становится понятно, что нужно решать проблему иначе. 

Исследовательская группа учила свою структуру  MolCLR тому, как использовать немаркированные данные, — нужно сравнить положительные и отрицательные пары из расширенного графа молекул. Графики, преобразованные из одной и той же молекулы, считаются положительной парой, а графики, преобразованные из разных молекул, — это отрицательная пара. Поэтому похожие молекулы остаются близко друг к другу, а остальные отодвигаются далеко.

Во время тестов модель машинного обучения работала эффективнее других и могла различать, какие химические вещества представляют наиболее серьезную угрозу для здоровья человека.

Читать далее:

Самое большое генеалогическое древо человечества показало историю нашего вида

Опасность бесплатных VPN. Почему их нельзя скачивать и как защитить себя?

Почему Ганимед — самый странный спутник и есть ли на нем жизнь

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Анализ крови определяет стадию болезни Альцгеймера с точностью 92%: это поможет подобрать терапию
Наука
ИИ впервые прошел тест Тьюринга: GPT-4.5 обманул людей в 73% случаев
Новости
В Сколково нашли способ увеличить емкость суперконденсаторов для электромобилей
Наука
ИИ ускорил поиск дефектов трубопроводов в 30 раз
Новости
Под пирамидами Гизы нашли «скрытый город», но с учеными согласны не все
Наука
В Земле нашли «червоточину»: что происходит с литосферой
Наука
Появились новые фото угрожающего Земле астероида
Космос
Российский ИТ-рынок замедляется: почему это происходит и что дальше
Новости
«Яндекс» запустил конкурента Google и ChatGPT: чем отличается и как работает
Новости
Трагедию с Xiaomi на автопилоте начали расследовать в Китае
Новости
Посмотрите, как выглядит самый быстрый пассажирский самолет в мире
Новости
Странная форма материи меняет планеты: как она повлияет на Землю
Космос
Новые фотодиоды в 10 раз чувствительнее аналогов: они пригодятся в медицине
Наука
В России создадут региональный совет по дронам: зачем он нужен
Новости
Государство компенсирует бизнесу 20% затрат на роботов: как работает система
Новости
Разработан маршрутизатор для фотонов: он объединит квантовые компьютеры в единую сеть
Наука
ИИ обнаружил два новых гена, которые влияют на риск ишемического инсульта
Наука
Создание изображений в стиле Ghibli привело к рекордной нагрузке на ChatGPT
Новости
Физики МГУ оценили потенциал фотонных процессоров для нейросетей
Новости
Телескоп НАСА для изучения ранней Вселенной сделал первые снимки
Космос