Чат-бота с ИИ научили взламывать другие чат-боты с ИИ

Ученые-компьютерщики из Наньянского технологического университета придумали, как скомпрометировать чат-ботов с искусственным интеллектом (ИИ). Для этого они обучили чат-бот создавать подсказки, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Исследователи использовали двойной метод «взлома» LLM (большой языковой модели), который они назвали «Masterkey». 

Для начала они провели реверс-инжиниринг того, как LLM находят вредоносные запросы и защищаются от них. Используя эту информацию, они научили модель автоматически учиться и выдавать подсказки, которые обходят защиту других LLM. Этот процесс можно автоматизировать, создав LLM для взлома, которая адаптируется и создает новые запросы для взлома даже после того, как разработчики исправят свои модели.

Выводы ученых помогут компаниям и предприятиям выявить слабые стороны и ограничения чат-ботов LLM, чтобы принять меры по их защите от хакеров.

Ученые провели серию проверочных тестов на разных LLM (каких именно, не разглашается), чтобы доказать работу метода. Затем исследователи немедленно сообщили о проблемах соответствующим поставщикам услуг после успешных атак с джейлбрейком.

Джейлбрейк — это термин в области компьютерной безопасности, при котором компьютерные хакеры находят и используют недостатки в программном обеспечении системы, чтобы заставить ее делать то, что ее разработчики намеренно запретили делать.

Читать далее:

Физики разработали эксперимент по превращению света в материю

Ученые провели квантовую «телепортацию» изображений по сети

Творение Вселенной объяснили по-новому: как это меняет физику

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Японский лунный модуль подлетел к Луне и сфотографировал спутник вблизи
Космос
Дикие рыбы способны запоминать и узнавать дайверов, показал эксперимент
Наука
НАСА почти на 40% повысило риск падения на Землю астероида, способного уничтожить город
Космос
Биоинженеры создали из мидий и слизи антибактериальный клей
Наука
Телескоп с «глазом лобстера» обнаружил редкую двойную звездную систему
Космос
Solar Orbiter приблизится к Венере, чтобы подняться к полюсу Солнца
Космос
В Китае объединили солнечную энергетику с выращиванием морских огурцов
Новости
Какие навыки нужны системному аналитику
Технологии
Появление речи связали с эволюцией одного белка
Наука
Для запрещенной соцсети проложат крупнейший в мире подводный кабель
Новости
Илон Маск представил Grok 3 — ИИ нового поколения с мощным дата-центром
Новости
Эксперты проверили «чудо» со статуей Девы Марии: что показал ДНК-тест
Наука
Время может двигаться вперед и назад одновременно: что выяснили физики
Наука
Космологический принцип Вселенной поставили под сомнение
Космос
Ядерные часы могут появиться в России уже в 2030 году  
Наука
Эмоции животных теперь можно определить с помощью ИИ
Новости
Создан переключатель генов для клеточной терапии на основе пластыря
Наука
Ученые предположили, что разумная жизнь на Земле — закономерность, а не случайность
Наука
Ледяные шапки на Земле — редкая аномалия, заявляют учение
Наука
OpenAI обновила правила ChatGPT, чтобы сократить «цензуру» в спорных вопросах
Новости