OpenAI Codex 后台操作电脑功能上线，支持多任务并行

OpenAI 今日发布了 Codex 桌面应用的新版本，带来一系列引人注目的功能更新。其中最核心的亮点是 后台计算机使用 能力，Codex 现在能够通过自己的光标在用户电脑上“看到、点击和输入”，操作所有应用程序，而不会干扰用户在前台的工作。这意味着多个 Codex 代理可以在 Mac 上并行工作，为用户处理任务。

深度解析新功能

这次更新并非零散的修补，而是围绕提升 Codex 作为“智能工作助手”的定位展开。除了后台操作，新版本还引入了 应用内网页浏览器，允许用户实时查看 Codex 在网页上的操作，并可在页面特定部分留下评论和指令，类似于团队协作中给设计师、开发者反馈的工具。这为前端开发、网页测试等场景提供了更直观的交互方式。

对于开发者而言，Codex 现在能运行多个终端标签页，并根据 GitHub 审查评论采取行动，进一步融入软件开发流程。此外，新增的 90 个插件 扩展了其工作流适用范围，使其不再局限于纯编码任务，而是向更广泛的通用知识工作领域渗透。

技术实现与行业背景

OpenAI 在博客中解释，后台计算机使用功能让 Codex 能“在后台使用你电脑上的所有应用”，这背后可能涉及屏幕识别、自动化控制等技术的深度整合。值得注意的是，Codex 还能 提前安排任务（几小时、几天甚至几周后执行），并在适当时间自动唤醒完成任务，这为长期、重复性工作自动化提供了可能。

另一个值得关注的细节是，Codex 现在能利用 gpt-image-1.5 生成图像，并可将这些图像纳入模型或设计中。虽然目前主要用于本地主机上的 Web 应用，但 OpenAI 表示“计划逐步扩展，使 Codex 能完全控制浏览器”。

战略意图：迈向“超级应用”

表面上看，这些更新似乎涉及不同领域，但 OpenAI 暗示它们共同服务于一个更大的愿景：构建未来的 “超级应用”。这个应用可能整合公司的 Atlas 浏览器、Codex 及其他代理工具，覆盖从开发到日常办公的广泛场景。Codex 负责人 Thibault Sottiaux 在媒体简报中提到，团队正在“实际执行”这一战略。

潜在影响与挑战

效率提升：后台多任务处理能力可显著减少人工切换应用、执行重复操作的时间，尤其适合测试、数据整理等场景。
安全与隐私：允许 AI 在后台操作电脑涉及敏感权限，用户需权衡便利性与风险。
生态扩展：插件增加和浏览器集成意味着 Codex 正从代码助手转型为多功能工作平台，可能挑战现有自动化工具市场。

小结

OpenAI Codex 的这次更新，标志着它从“编码辅助工具”向“全能工作代理”迈出了关键一步。后台操作、计划任务、浏览器集成等能力，不仅提升了实用性，更透露出 OpenAI 在构建一体化智能应用生态上的野心。随着 AI 代理逐渐融入日常 workflow，如何平衡自动化与用户控制，将成为行业持续探索的课题。

OpenAI Codex 新功能：后台操作电脑，多任务并行不干扰

延伸阅读

相关资讯