Google представила новую технологию для маркировки и распознавания текстов, созданных генеративными ИИ-моделями. Инструмент SynthID Text не повлияет на скорость и качество генерации контента и будет предоставлен бесплатно разработчикам и компаниям.

SynthID Text работает следующим образом: при генерации текста модель предсказывает, какой символ или слово будет следующим, основываясь на вероятностях, и добавляет дополнительную информацию в это распределение, что формирует своеобразный водяной знак. Этот знак позволяет определить, создан ли текст ИИ. Как объясняет Google, комбинация выбранных слов и скорректированных вероятностей образует «паттерн», который и выступает водяным знаком.

Компания подчеркивает, что инструмент, который весной интегрировали в Gemini, не влияет на точность, качество или скорость генерации. Однако тексты, подвергшиеся обрезке, перефразированию или иным изменениям, могут обрабатываться сложнее. В то же время слишком четкие вопросы ограничивают возможности модели по внесению изменений в распределение токенов без ущерба для точности ответа.

Google не единственная, кто разрабатывает такие технологии. Например, OpenAI также работала над внедрением водяных знаков для текстов, созданных ИИ, но приостановила процесс из-за технических и коммерческих сложностей. Если такие технологии станут массовыми, они помогут решить проблему с неточными детекторами ИИ, которые часто ошибочно классифицируют студенческие работы как созданные нейросетью. Некоторые страны уже начинают действовать в этом направлении: в Китае обязательная маркировка ИИ-контента уже введена, а в Калифорнии планируют аналогичные меры.

Читать далее:

Ученые нашли ключ к огромной энергии прямо у нас под ногами

Решение загадки физики трех тел уже близко: что выяснили ученые

План Илона Маска угрожает Марсу: ученый раскритиковал его идею

^{Обложка: Kandinsky by Sber AI}

Google начал помечать тексты, сгенерированные ИИ: как это работает