
Open Computer Use
opencomputeruse.ai
开源桌面自动化MCP,赋能AI代理操控电脑
10天前制作者:Leo
关于 Open Computer Use
Open Computer Use 是一款开源的桌面自动化工具,它将本地桌面操作转化为标准的 MCP(Model Context Protocol)服务,让 AI 代理能够像人类一样操控电脑。无论是 Codex、Claude Code、Gemini CLI、opencode 还是自定义 MCP 客户端,都可以通过它来检查应用界面、点击、输入、滚动、拖拽以及截取屏幕截图。它支持 macOS、Linux 和 Windows 三大平台,通过 npm 即可安装,旨在将非侵入式的 Codex 计算机使用体验引入任何代理堆栈。
核心功能
Open Computer Use 的核心在于将桌面自动化抽象为 MCP 服务,使得 AI 代理可以无缝地与操作系统交互。它提供了一套标准化的接口,让代理能够执行常见的 GUI 操作,如鼠标点击、键盘输入、窗口切换等,同时支持屏幕截图和元素定位,从而实现对复杂桌面应用的自动化控制。
主要特性
- 跨平台支持:兼容 macOS、Linux 和 Windows,确保在不同操作系统上的一致体验。
- 标准化 MCP 接口:基于 Model Context Protocol,方便与各种 AI 代理框架集成。
- 非侵入式设计:无需修改系统设置或安装额外驱动,安全可靠。
- 丰富的操作能力:支持点击、输入、滚动、拖拽、截图等常见桌面操作。
- 开源与易安装:完全开源,通过 npm 一键安装,降低使用门槛。
适用场景
Open Computer Use 适用于需要 AI 代理直接操控桌面应用的场景,例如自动化测试、智能助手、RPA(机器人流程自动化)以及 AI 驱动的软件演示。开发者可以将其集成到自己的 AI 代理工作流中,让代理完成诸如填写表单、操作设计软件、管理文件等任务。