
OpenAI Codex 新功能:后台操作电脑,多任务并行不干扰
OpenAI 今日发布了 Codex 桌面应用的新版本,带来一系列引人注目的功能更新。其中最核心的亮点是 后台计算机使用 能力,Codex 现在能够通过自己的光标在用户电脑上“看到、点击和输入”,操作所有应用程序,而不会干扰用户在前台的工作。这意味着多个 Codex 代理可以在 Mac 上并行工作,为用户处理任务。
深度解析新功能
这次更新并非零散的修补,而是围绕提升 Codex 作为“智能工作助手”的定位展开。除了后台操作,新版本还引入了 应用内网页浏览器,允许用户实时查看 Codex 在网页上的操作,并可在页面特定部分留下评论和指令,类似于团队协作中给设计师、开发者反馈的工具。这为前端开发、网页测试等场景提供了更直观的交互方式。
对于开发者而言,Codex 现在能运行多个终端标签页,并根据 GitHub 审查评论采取行动,进一步融入软件开发流程。此外,新增的 90 个插件 扩展了其工作流适用范围,使其不再局限于纯编码任务,而是向更广泛的通用知识工作领域渗透。
技术实现与行业背景
OpenAI 在博客中解释,后台计算机使用功能让 Codex 能“在后台使用你电脑上的所有应用”,这背后可能涉及屏幕识别、自动化控制等技术的深度整合。值得注意的是,Codex 还能 提前安排任务(几小时、几天甚至几周后执行),并在适当时间自动唤醒完成任务,这为长期、重复性工作自动化提供了可能。
另一个值得关注的细节是,Codex 现在能利用 gpt-image-1.5 生成图像,并可将这些图像纳入模型或设计中。虽然目前主要用于本地主机上的 Web 应用,但 OpenAI 表示“计划逐步扩展,使 Codex 能完全控制浏览器”。
战略意图:迈向“超级应用”
表面上看,这些更新似乎涉及不同领域,但 OpenAI 暗示它们共同服务于一个更大的愿景:构建未来的 “超级应用”。这个应用可能整合公司的 Atlas 浏览器、Codex 及其他代理工具,覆盖从开发到日常办公的广泛场景。Codex 负责人 Thibault Sottiaux 在媒体简报中提到,团队正在“实际执行”这一战略。
潜在影响与挑战
- 效率提升:后台多任务处理能力可显著减少人工切换应用、执行重复操作的时间,尤其适合测试、数据整理等场景。
- 安全与隐私:允许 AI 在后台操作电脑涉及敏感权限,用户需权衡便利性与风险。
- 生态扩展:插件增加和浏览器集成意味着 Codex 正从代码助手转型为多功能工作平台,可能挑战现有自动化工具市场。
小结
OpenAI Codex 的这次更新,标志着它从“编码辅助工具”向“全能工作代理”迈出了关键一步。后台操作、计划任务、浏览器集成等能力,不仅提升了实用性,更透露出 OpenAI 在构建一体化智能应用生态上的野心。随着 AI 代理逐渐融入日常 workflow,如何平衡自动化与用户控制,将成为行业持续探索的课题。