Чат-бота с ИИ научили взламывать другие чат-боты с ИИ

Ученые-компьютерщики из Наньянского технологического университета придумали, как скомпрометировать чат-ботов с искусственным интеллектом (ИИ). Для этого они обучили чат-бот создавать подсказки, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Исследователи использовали двойной метод «взлома» LLM (большой языковой модели), который они назвали «Masterkey». 

Для начала они провели реверс-инжиниринг того, как LLM находят вредоносные запросы и защищаются от них. Используя эту информацию, они научили модель автоматически учиться и выдавать подсказки, которые обходят защиту других LLM. Этот процесс можно автоматизировать, создав LLM для взлома, которая адаптируется и создает новые запросы для взлома даже после того, как разработчики исправят свои модели.

Выводы ученых помогут компаниям и предприятиям выявить слабые стороны и ограничения чат-ботов LLM, чтобы принять меры по их защите от хакеров.

Ученые провели серию проверочных тестов на разных LLM (каких именно, не разглашается), чтобы доказать работу метода. Затем исследователи немедленно сообщили о проблемах соответствующим поставщикам услуг после успешных атак с джейлбрейком.

Джейлбрейк — это термин в области компьютерной безопасности, при котором компьютерные хакеры находят и используют недостатки в программном обеспечении системы, чтобы заставить ее делать то, что ее разработчики намеренно запретили делать.

Читать далее:

Физики разработали эксперимент по превращению света в материю

Ученые провели квантовую «телепортацию» изображений по сети

Творение Вселенной объяснили по-новому: как это меняет физику

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Китай показал лазерную передачу данных со спутника со скоростью 100 Гбит/с
Космос
Кольцо весом 500 кг упало на Землю: откуда оно — неизвестно
Космос
Болезнь Альцгеймера связали с вирусом, которым заражены миллиарды людей
Наука
В Венгрии нашли древнейшее средневековое захоронение женщины с оружием
Наука
Ученые измерили излучение от смартфонов и сетей связи 5G
Новости
Раскрыта тайна миграции летучих мышей: они могут «оседлать шторм»
Наука
Китай обогнал Starlink: данные с орбиты передали со скоростью 100 Гбит/с
Космос
Найден неуловимый вулкан, который охладил Землю во времена Пушкина
Наука
Полеты к Луне, новый телескоп и анализ астероида: за какими миссиями следить в 2025 году
Кейсы
Как викинги и германцы пересекали Европу: анализ ДНК раскрыл пути древней миграции
Наука
Анализ «генеалогии» использовали для выявления опасных бактерий и вирусов
Наука
Астрофизики отследили источник радиосигнала из далекой галактики
Космос
Робот на водке, тараканы-киборги и механический голубь: необычные устройства 2024 года
Кейсы
Лучшее за 2024 год: интересные статьи партнеров
Кейсы
Борьба с ВИЧ, карта мозга и супер-земля: открытия 2024 года, изменившие мир
Кейсы
Чем запомнился 2024 год в изучении космоса: лунные миссии, успехи Маска и тайны темной материи
Кейсы
Неожиданное место активности гравитационных волн нашли в космосе
Космос
Астрономы нашли гигантский резервуар воды в космосе
Космос
У библейской горы в Иерусалиме обнаружили редкий артефакт
Наука
Кто-то смотрит в космос: посмотрите на туманность с необычной формой
Космос