Исследователи из Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) сообщили о создании приложения, которое определяет, был ли текст написан живым человеком или сгенерирован искусственным интеллектом. Технология поможет «ловить» ботов, которые использует разные большие языковые модели и не зависит от совершенствования нейросетей.

Разработчики пока не опубликовали модель и ее описание в открытом доступе или рецензируемых журналах. По сообщению университета, система одновременно использует несколько «следов», основанных на разных математических моделей.

В частности, ученые использовали теорию хаотических динамических систем, топологический анализ данных, теорию размерности, теория кластеризации (четкой и нечеткой) и другие. Хотя боты и нейросети могут имитировать одну или даже несколько характеристик, но «подделать» их все крайне трудно.

Существующие технологии ориентируются на поиск следов конкретных архитектур, например, использования определенной версии ChatGPT. В результате системы не носят универсальный характер и устаревают по мере обновления больших языковых моделей, отмечают в НИУ ВШЭ. Новый подход позволяет обойти эти ограничения.

Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов.
Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ

Разработчики планируют протестировать свою модель на различных текстах, в том числе, художественных произведениях, написанных нейросетями, и выпускных работах студентов вуза. После этого в следующем году система будет открыта для публичного использования.

Читать далее:

Музею анонимно прислали уникальную находку: что это было

Загляните в сердце в одной из самых опасных пирамид в мире

Посмотрите, как пчелы шлепают муравьев, чтобы защитить свои ульи

_{На обложке: Изображение от kenshinstock на Freepik, сведения о лицензии}

В ВШЭ придумали, как отличать тексты, сгенерированные ИИ для ботов