OpenAI подтвердила, что ChatGPT анализирует переписки пользователей на предмет потенциально опасного контента и в отдельных случаях передает информацию правоохранительным органам.
На фоне растущей критики после случаев самоубийств и нанесения вреда по советам чат-бота представители OpenAI рассказали в своем блоге, как компания модерирует диалоги пользователей с ИИ. Когда алгоритмы выявляют пользователей, «планирующих причинить вред другим», сообщения направляются на проверку специально обученной команде сотрудников.
«Если специалисты при проверке определят, что дело связано с непосредственной угрозой причинения серьезного физического вреда другим, мы можем передать его в правоохранительные органы», — пояснили в OpenAI. При этом компания не раскрывает количество таких случаев и не уточняет, в каких странах сотрудничает с полицией.
В то же время в OpenAI подчеркнули, что «не передают дела о нанесении вреда самому себе в правоохранительные органы, чтобы уважать конфиденциальность пользователей». В подобных случаях чат-бот должен перенаправлять пользователей к специалистам и горячим линиям поддержки.
Чтобы улучшить диагностику проблемных ситуаций, компания привлекает экспертов из разных стран. В сообщении говорится о сотрудничестве с более чем 90 врачами из 30 стран — психиатрами, педиатрами и врачами общей практики, а также о создании консультативной группы по психическому здоровью.
Правила использования OpenAI не дают четкого понимания, какие именно типы разговоров могут быть переданы для проверки человеком или правоохранителям. Компания ограничилась общими формулировками о запрете «пропаганды самоубийства», «разработки оружия» и «нанесения вреда другим».
В августе OpenAI запустила GPT-5, которая стала моделью по умолчанию, хотя пользователи с платной подпиской могут продолжать пользоваться предыдущими версиями. По заявлению компании, после обновления количество неподходящих ответов в чрезвычайных ситуациях снизилось более чем на 25% по сравнению с прошлой версией.
Компания также рассказала, что работает над новыми мерами безопасности: упрощение доступа к службам экстренной помощи, возможность связи с доверенными контактами и усиленную защиту для подростков, включая функцию родительского контроля.
Читать далее:
В переводчик Google добавили функции для изучения языков
Посмотрите, как сотни сомов взбираются вверх по водопаду
Самая далекая звезда — не то, чем кажется, считают астрономы
Обложка: AI | frimufilms