SheepNav
新上线昨天112 投票

驾驭工程:在智能体优先的世界里最大化 Codex 的价值

在过去的五个月里,一支工程团队进行了一项大胆的实验:完全依靠 AI 代码生成工具 Codex(基于 GPT-5)构建并交付了一款软件产品,全程没有一行手写代码。这个产品拥有内部日活用户和外部 alpha 测试者,能够正常发布、部署、出现问题并得到修复,但所有代码——包括应用逻辑、测试、CI 配置、文档、可观测性以及内部工具——均由 Codex 生成。团队估计,相比传统手写代码,开发时间缩短了约 10 倍

这一实验的核心原则是:人类负责引导,智能体负责执行。团队刻意设定了“零手写代码”的约束,目的是探索当软件工程团队的主要任务不再是编写代码时,工作方式会发生怎样的根本性变化。

从空仓库起步

实验始于 2025 年 8 月底的一个空 Git 仓库。第一个提交——包括仓库结构、CI 配置、格式化规则、包管理器设置和应用框架——全部由 Codex CLI 基于少量现有模板生成。甚至指导智能体如何工作的 AGENTS.md 文件本身也是由 Codex 编写的。从一开始,仓库就由智能体塑造,没有任何预先存在的手写代码作为锚点。

五个月后,仓库中包含了约 100 万行代码,涵盖应用逻辑、基础设施、工具、文档和内部开发者工具。在此期间,一个由 3 名工程师 组成的小团队驱动 Codex 完成了约 1500 个 Pull Request 的合并,平均每位工程师每天产出 3.5 个 PR。有趣的是,随着团队扩大到 7 人,吞吐量不降反升。

关键经验:从写代码到设计环境

团队发现,当智能体负责代码实现时,人类工程师的核心技能发生了迁移:

  • 设计环境:不再关注具体语法,而是定义清晰的目录结构、API 契约和测试框架,为智能体提供高效的“工作台”。
  • 明确意图:用自然语言精确描述需求,包括边界条件、性能目标和错误处理方式,而非逐行指定实现细节。
  • 构建反馈回路:通过自动化测试、代码审查和可观测性工具,让智能体快速获得执行结果的反馈,从而自我修正。

挑战与教训

并非一切顺利。团队也遇到了不少挑战:

  • 调试成本转移:当 Codex 生成的代码出现 bug 时,调试往往比手写代码更困难,因为需要理解 AI 的“思路”。团队不得不投入更多精力在日志和可观测性上。
  • 一致性维护:随着代码库膨胀,不同 PR 中 Codex 可能采用不同的实现风格,导致技术债务。团队通过严格的 AGENTS.md 和模板来约束。
  • 人类注意力是稀缺资源:虽然代码生成速度极快,但代码审查、设计决策和问题定位仍需人类深度参与。团队的核心瓶颈从“写代码”变成了“做决策”。

对行业的启示

这个实验证明,AI 智能体驱动的开发(Agent-Driven Development) 已不再是概念,而是可以交付真实产品的可行模式。它重新定义了工程师的角色:从“代码生产者”转变为“系统设计师和智能体协调者”。

团队总结道:“我们最大的收获是,人类的时间与注意力才是真正的稀缺资源。智能体负责执行,但方向、质量和创造力依然由人类掌控。”

随着 Codex 和类似工具的持续进化,这种“人类引导、智能体执行”的开发范式可能会成为主流,大幅降低软件开发的边际成本,加速产品创新。

延伸阅读

  1. OpenAI 推出“锁定模式”,严防提示注入攻击窃取敏感数据
  2. WWDC 2026 前瞻:Siri 重大改版与 Apple Intelligence 更新
  3. 白宫AI顾问斯里拉姆·克里希南将于6月底离职,计划创建新机构继续影响特朗普AI政策
查看原文