Весной компания Anthropic объявила о разработке ИИ, который сможет выполнять офисные задачи, автоматизируя значительную часть экономики. Сегодня они представили обновленную модель Claude 3.5 Sonnet, которая через API может взаимодействовать с любым десктопным приложением, имитируя действия человека: нажатия клавиш, клики мышью и другие жесты.
Claude 3.5 Sonnet распознает происходящее на экране, анализирует скриншоты и рассчитывает, как ему действовать для выполнения задач. Anthropic называет это «слоем действия-исполнения», который позволяет Claude выполнять команды на уровне рабочего стола, используя любые приложения и сайты. Для этого пользователи предоставляют доступ, а ИИ использует его для выполнения действий, таких как заполнение форм или взаимодействие с программным обеспечением.
Такие ИИ-агенты, как Claude, обещают упростить автоматизацию, но это не новая идея. Подобные инструменты разрабатывают Microsoft, OpenAI и другие компании. Однако Claude 3.5 отличается улучшенной производительностью: он может решать сложные задачи, требующие сотен шагов, и корректирует свои действия, если сталкивается с проблемами. Тем не менее, модель сталкивается с трудностями, такими как прокрутка и масштабирование экрана, что снижает её эффективность в некоторых задачах.
Вопросы безопасности также остаются актуальными. Модели, использующие десктопные приложения, могут стать уязвимыми для атак и утечек данных. Anthropic признает риски, но считает, что лучше контролировать процессы с менее мощными моделями и изучать потенциальные угрозы, постепенно улучшая защиту.
Читать далее:
Ученые нашли ключ к огромной энергии прямо у нас под ногами
Решение загадки физики трех тел уже близко: что выяснили ученые
План Илона Маска угрожает Марсу: ученый раскритиковал его идею