Чат-бота с ИИ научили взламывать другие чат-боты с ИИ

Ученые-компьютерщики из Наньянского технологического университета придумали, как скомпрометировать чат-ботов с искусственным интеллектом (ИИ). Для этого они обучили чат-бот создавать подсказки, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Исследователи использовали двойной метод «взлома» LLM (большой языковой модели), который они назвали «Masterkey». 

Для начала они провели реверс-инжиниринг того, как LLM находят вредоносные запросы и защищаются от них. Используя эту информацию, они научили модель автоматически учиться и выдавать подсказки, которые обходят защиту других LLM. Этот процесс можно автоматизировать, создав LLM для взлома, которая адаптируется и создает новые запросы для взлома даже после того, как разработчики исправят свои модели.

Выводы ученых помогут компаниям и предприятиям выявить слабые стороны и ограничения чат-ботов LLM, чтобы принять меры по их защите от хакеров.

Ученые провели серию проверочных тестов на разных LLM (каких именно, не разглашается), чтобы доказать работу метода. Затем исследователи немедленно сообщили о проблемах соответствующим поставщикам услуг после успешных атак с джейлбрейком.

Джейлбрейк — это термин в области компьютерной безопасности, при котором компьютерные хакеры находят и используют недостатки в программном обеспечении системы, чтобы заставить ее делать то, что ее разработчики намеренно запретили делать.

Читать далее:

Физики разработали эксперимент по превращению света в материю

Ученые провели квантовую «телепортацию» изображений по сети

Творение Вселенной объяснили по-новому: как это меняет физику

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Российский планшет Yadro поступил в продажу: известна его цена и планы на будущее
Новости
Стала известна цена первого российского электромобиля «Атом»
Новости
Опубликованы самые детальные фото поверхности Европы
Космос
Первую в мире водородную яхту спустили на воду: ее длина больше 100 м
Новости
Открытие ученых впервые подтвердило правоту Эйнштейна
Космос
У зонда летящего к Меркурию произошел сбой двигателя
Космос
Замороженная ткань мозга восстановилась после 18 месяцев криоконсервации
Наука
Редкий глубоководный кальмар попал на видео, напав на подводную камеру
Наука
Экспресс-тест обнаруживает инсульт менее чем за шесть часов после первых симптомов
Наука
Канадский фермер, возможно, нашел на поле обломок ракеты SpaceX
Космос
Квантовую связь создали с помощью обычного городского оптоволоконного кабеля
Новости
Частный спутник сфотографировал МКС с расстояния 70 км
Космос
Ученые сварили пиво с помощью пчел-убийц
Наука
В НАСА рассказали, что вызвало самую мощную геомагнитную бурю десятилетия
Космос
Суперноги от MIT помогут людям быстро вставать после падений на Луне
Космос
Первому в мире ребенку вылечили глухоту с помощью генной терапии
Наука
Ученые нашли семь звезд в Млечном Пути, рядом с которыми могут жить инопланетяне
Космос
Забота об экологии и цифровой мир: какой софт помогает заботиться об окружающей среде?
Мнения
«Уэбб» поймал самое старое слияние черных дыр: через 740 млн лет после Большого взрыва
Космос
Искусственный интеллект научили распознавать сарказм
Новости