Исследователи из Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) сообщили о создании приложения, которое определяет, был ли текст написан живым человеком или сгенерирован искусственным интеллектом. Технология поможет «ловить» ботов, которые использует разные большие языковые модели и не зависит от совершенствования нейросетей.
Разработчики пока не опубликовали модель и ее описание в открытом доступе или рецензируемых журналах. По сообщению университета, система одновременно использует несколько «следов», основанных на разных математических моделей.
В частности, ученые использовали теорию хаотических динамических систем, топологический анализ данных, теорию размерности, теория кластеризации (четкой и нечеткой) и другие. Хотя боты и нейросети могут имитировать одну или даже несколько характеристик, но «подделать» их все крайне трудно.
Существующие технологии ориентируются на поиск следов конкретных архитектур, например, использования определенной версии ChatGPT. В результате системы не носят универсальный характер и устаревают по мере обновления больших языковых моделей, отмечают в НИУ ВШЭ. Новый подход позволяет обойти эти ограничения.
Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов.
Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ
Разработчики планируют протестировать свою модель на различных текстах, в том числе, художественных произведениях, написанных нейросетями, и выпускных работах студентов вуза. После этого в следующем году система будет открыта для публичного использования.
Читать далее:
Музею анонимно прислали уникальную находку: что это было
Загляните в сердце в одной из самых опасных пирамид в мире
Посмотрите, как пчелы шлепают муравьев, чтобы защитить свои ульи
На обложке: Изображение от kenshinstock на Freepik, сведения о лицензии