Как ИИ принимает решения: ученые нашли способ заглянуть внутрь системы

Метод SAE Match, разработанный лабораторией T-Bank AI Research, позволяет отслеживать и корректировать процесс принятия решений искусственным интеллектом на разных этапах вычислений, сообщает пресс-служба банка. Препринт исследования опубликован на портале arXiv.

Исследователи из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали метод SAE Match для анализа механизмов принятия системам ИИ решений. Технология позволяет наблюдать, как в больших языковых моделях в процессе рассуждений от слоя к слою меняются концепции и почему ИИ в конце концов приходит к определенному заключению.

Современные модели машинного обучения работают как многослойные системы, где каждый последующий слой обрабатывает результаты предыдущего. Таким образом модель старается улучшить свои предсказания слой за слоем. До сих пор не существовало эффективных методов отслеживания эволюции концепций внутри таких моделей. SAE Match анализирует, как трансформируются данные на разных этапах обработки.

На схеме показана работа предложенного метода. На разных слоях присутствуют схожие признаки, метод находит соответствие между ними без использования дополнительных данных

Эксперименты на ряде моделей показали, что метод помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети. Это делает поведение ИИ более предсказуемым и понятным. В результате исследователи могут заглянуть внутрь модели, контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных.

«Наша задача не только сделать модели лучше, но и понять, как они работают изнутри», — поясняет Никита Балаганский, руководитель научной группы LLM Foundations T-Bank AI Research. Он приводит пример ИИ-ассистента для детей, который может начать выдавать недостоверную информацию. С помощью SAE Match такие проблемы можно будет обнаружить и оперативно исправить без дорогостоящего переобучения всей модели.

Результаты исследования представят на международной конференции по обучению представлений (ICRL) в Сингапуре, которая пройдет с 24 по 28 апреля 2025 года.


Читать далее:

Выяснилось, из чего состоит загадочная темная материя

Ученые в тупике: «Уэбб» засек невозможный свет в галактике

Названа главная опасность брака: оказалось, это приводит к деменции

На обложке: Изображение от DC Studio на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Эта черная дыра «проснулась» настолько голодной, что нарушила все модели ученых
Космос
Мошенники начали использовать схему с домофоном, чтобы красть деньги с банковских карт
Новости
Галактика-соседка Млечного Пути начинает разрушаться: что происходит
Космос
Россиян поздравили с Днем космонавтики прямо с МКС
Космос
Разработаны «бактерии-шпионы»: они посылают сигнал, заметный с высоты
Наука
Ученые разработали «плащ-невидимку» для нейронов для лечения Паркинсона
Наука
В России разработали проект строительства атомной электростанции на Луне
Космос
Пробуждение гиганта: яркие вспышки наблюдали у проснувшейся черной дыры
Космос
В ИТМО придумали, как «продлить жизнь» ракового белка для тестирования лекарств
Наука
Создана карта полумиллиарда нейронных связей, которые позволяют мышам видеть
Наука
Ученые из Яндекса и MIT придумали, как запускать LLM на ноутбуках и смартфонах
Новости
Облачную платформу для квантовых вычислений создали в Университете Иннополис
Новости
Эйнштейн ошибся: возможно, пространства-времени вообще не существует
Космос
Тестовый снимок «Гершель» показал скрытые галактики во Вселенной
Космос
«Яндекс» ищет хакеров, чтобы проверить безопасность нейросетей
Новости
Запрет ИИ обсудят в России: каким будет новый закон
Наука
Google показала Ironwood: чип для ИИ, который в 24 раза быстрее самого мощного суперкомпьютера
Новости
Найдена связь между незаметными повреждениями мозга и риском деменции
Наука
Ученые придумали, как защитить изделий из титана в экстремальных условиях
Новости
Посмотрите на боевого робота-скарабея: его сделали в Москве
Новости