Весной компания Anthropic объявила о разработке ИИ, который сможет выполнять офисные задачи, автоматизируя значительную часть экономики. Сегодня они представили обновленную модель Claude 3.5 Sonnet, которая через API может взаимодействовать с любым десктопным приложением, имитируя действия человека: нажатия клавиш, клики мышью и другие жесты.

Claude 3.5 Sonnet распознает происходящее на экране, анализирует скриншоты и рассчитывает, как ему действовать для выполнения задач. Anthropic называет это «слоем действия-исполнения», который позволяет Claude выполнять команды на уровне рабочего стола, используя любые приложения и сайты. Для этого пользователи предоставляют доступ, а ИИ использует его для выполнения действий, таких как заполнение форм или взаимодействие с программным обеспечением.

Такие ИИ-агенты, как Claude, обещают упростить автоматизацию, но это не новая идея. Подобные инструменты разрабатывают Microsoft, OpenAI и другие компании. Однако Claude 3.5 отличается улучшенной производительностью: он может решать сложные задачи, требующие сотен шагов, и корректирует свои действия, если сталкивается с проблемами. Тем не менее, модель сталкивается с трудностями, такими как прокрутка и масштабирование экрана, что снижает её эффективность в некоторых задачах.

Вопросы безопасности также остаются актуальными. Модели, использующие десктопные приложения, могут стать уязвимыми для атак и утечек данных. Anthropic признает риски, но считает, что лучше контролировать процессы с менее мощными моделями и изучать потенциальные угрозы, постепенно улучшая защиту.

Читать далее:

Ученые нашли ключ к огромной энергии прямо у нас под ногами

Решение загадки физики трех тел уже близко: что выяснили ученые

План Илона Маска угрожает Марсу: ученый раскритиковал его идею

Новый ИИ сам может управлять компьютерами