Anthropic 升级 Claude:Code 与 Cowork 工具现可自主控制你的电脑
Anthropic 推出 Claude 电脑自主控制功能:AI 助手迈向“实体操作”新阶段
AI 公司 Anthropic 近日宣布,为其 Claude 模型的 Code 和 Cowork AI 工具推出了一项突破性更新:这些 AI 助手现在能够自主控制用户的电脑,执行包括打开文件、使用浏览器和应用程序、运行开发工具等一系列任务。这项功能目前以“研究预览”形式向 Claude Pro 和 Max 订阅用户开放,但暂时仅限于 macOS 设备。
功能如何运作?
根据 Anthropic 的公告,这项新功能旨在实现“零设置”的自动化操作。其核心机制是:
- 权限先行:Claude 在执行任何电脑操作前,都会明确请求用户的许可,确保控制权始终在用户手中。
- 双管齐下的执行方式:
- 优先连接器:对于 Slack、Google Workspace 等已支持集成的服务,Claude 会优先通过这些专用连接器高效完成任务。
- 直接界面控制:当没有现成连接器时,Claude 会转而直接控制你的浏览器、鼠标、键盘和显示器,通过模拟人类操作(如探索、滚动、点击)来达成目标。
- 跨设备协同:用户需要在支持的 macOS 设备上运行 Claude 桌面应用,并将其与 Claude 手机应用配对。这使得用户即使不在电脑旁,也能通过手机指派任务给桌面端的 Claude 执行。
技术背景与战略意图
此次更新并非凭空而来。它建立在 2024 年 Claude 3.5 Sonnet 模型引入的自主能力之上,但将这种能力从纯粹的对话与代码生成,扩展到了能够**与物理计算机界面进行交互的“AI 代理”**层面。这标志着 Anthropic 在推动 AI 从“思考与建议”走向“感知与执行”的路径上迈出了关键一步。
在 AI 助手竞争日益激烈的当下(如与 ChatGPT、Gemini 的竞争),Anthropic 此举意在强化 Claude 在开发者生产力和复杂工作流自动化场景下的独特价值。Code 和 Cowork 工具本就是为编程和协作场景设计,赋予它们直接操作电脑的能力,理论上可以无缝衔接代码编写、环境配置、测试运行、文档查找等一连串动作,极大提升效率。
当前局限与未来展望
Anthropic 坦诚地指出了该预览功能的局限性:
- 平台限制:目前仅支持 macOS,Windows 和 Linux 用户还需等待。
- 性能瓶颈:通过屏幕操作的方式比直接 API 集成速度更慢,且复杂的任务有时需要重试才能成功。
- “早期分享”模式:Anthropic 明确表示,他们“提前分享此功能是因为想了解它在哪些地方有效,在哪些地方不足”。这符合其一贯的审慎研究风格,旨在通过真实用户反馈来迭代改进,而非急于推出一个不成熟的产品。
这项功能与 Anthropic 近期推出的 Dispatch(跨设备任务分派)功能结合使用时效果尤佳,构成了一个从移动端发起、在桌面端自动执行的远程工作闭环。
行业意义与潜在影响
Claude 获得电脑控制权,是 AI 向“具身智能”(Embodied AI)或至少是“数字环境具身”方向演进的一个显著信号。它不再仅仅是一个回答问题的聊天窗口,而是变成了一个可以主动在用户数字工作空间中“动手”的智能体。
这引发了关于效率与安全的经典权衡:
- 效率提升:对于开发者、研究人员、内容创作者等专业人士,一个能自动处理繁琐、重复电脑操作的 AI 助手无疑是强大的生产力倍增器。
- 安全与隐私考量:尽管有明确的权限请求机制,但允许 AI 直接操控核心生产工具(电脑),必然会对安全架构、隐私保护、操作审计提出更高要求。Anthropic 选择以研究预览形式、在有限平台推出,正是为了在可控范围内探索这些边界。
小结:Anthropic 此次更新,将 Claude 从“顾问”角色部分转向了“执行者”角色。虽然目前仍处于受限的研究预览阶段,且存在速度慢、平台窄等缺点,但它清晰地指向了 AI 助手发展的下一个前沿——深度融入并自动化用户的数字工作流。其成功与否,将取决于 Anthropic 能否在提升自动化能力的同时,构建起足够坚固的安全与信任屏障。