SheepNav
精选24天前0 投票

从模型到智能体:为Responses API配备计算机环境

OpenAI如何构建智能体运行时环境

OpenAI宣布通过将Responses APIshell工具托管容器工作空间相结合,构建了一个完整的智能体运行时环境,标志着从单一任务模型向复杂工作流智能体的重要转变。

为什么需要计算机环境?

当前AI应用正从使用擅长特定任务的模型,转向能够处理复杂工作流的智能体。仅通过提示模型只能访问其训练过的知识,但赋予模型一个计算机环境可以解锁更广泛的应用场景,例如运行服务、从API请求数据,或生成电子表格、报告等实用成果。

然而,构建智能体面临几个实际问题:

  • 中间文件存放在哪里?
  • 如何避免将大型表格粘贴到提示中?
  • 如何为工作流提供网络访问而不引发安全担忧?
  • 如何在不自行构建工作流系统的情况下处理超时和重试?

Responses API的增强方案

OpenAI的解决方案不是让开发者自行构建执行环境,而是为Responses API配备必要的组件,使其能够可靠地执行现实世界任务。核心架构包括:

  1. Responses API:作为智能体的核心接口,负责接收指令并协调执行。
  2. Shell工具:实现紧密的执行循环——模型提出读取文件或通过API获取数据等操作,平台运行该操作,结果反馈到下一步。
  3. 托管容器工作空间:提供隔离的执行环境,具备文件系统用于输入输出、可选的SQLite等结构化存储,以及受限制的网络访问。

智能体工作流的执行机制

一个高效的智能体工作流始于紧密的执行循环。模型提出动作建议,平台在隔离环境中运行,结果用于后续步骤。以shell工具为例,它展示了模型如何使用工具的一般原理:

  • 在训练期间,模型通过逐步示例学习工具的使用方法和效果。
  • 当模型“使用工具”时,实际上只是提出工具调用建议,无法自行执行调用。
  • 平台负责安全地执行这些调用,确保操作可控且结果可追溯。

早期经验与行业意义

OpenAI分享的初步经验表明,这种环境能够实现更快、更可重复且更安全的生产工作流。对于AI行业而言,这代表着一个关键演进:

  • 降低开发门槛:开发者无需从零构建复杂的基础设施,即可部署具备实际交互能力的智能体。
  • 提升应用范围:从简单的文本生成扩展到数据处理、自动化报告生成等实际业务场景。
  • 强化安全可控:通过隔离环境和受限网络访问,平衡功能性与安全性需求。

随着智能体逐渐成为AI应用的主流形态,OpenAI的这一举措可能推动更多企业采用类似架构,加速AI在复杂任务中的落地进程。

延伸阅读

  1. Donut Browser:开源反检测浏览器,支持无限用户配置文件
  2. Klick AI 相机助手:实时 AI 相机,现场指导构图
  3. Vista:macOS 本该内置的图片查看器
查看原文