精选4个月前0 投票

从模型到智能体：为Responses API配备计算机环境

OpenAI如何构建智能体运行时环境

OpenAI宣布通过将Responses API与shell工具和托管容器工作空间相结合，构建了一个完整的智能体运行时环境，标志着从单一任务模型向复杂工作流智能体的重要转变。

为什么需要计算机环境？

当前AI应用正从使用擅长特定任务的模型，转向能够处理复杂工作流的智能体。仅通过提示模型只能访问其训练过的知识，但赋予模型一个计算机环境可以解锁更广泛的应用场景，例如运行服务、从API请求数据，或生成电子表格、报告等实用成果。

然而，构建智能体面临几个实际问题：

中间文件存放在哪里？
如何避免将大型表格粘贴到提示中？
如何为工作流提供网络访问而不引发安全担忧？
如何在不自行构建工作流系统的情况下处理超时和重试？

Responses API的增强方案

OpenAI的解决方案不是让开发者自行构建执行环境，而是为Responses API配备必要的组件，使其能够可靠地执行现实世界任务。核心架构包括：

Responses API：作为智能体的核心接口，负责接收指令并协调执行。
Shell工具：实现紧密的执行循环——模型提出读取文件或通过API获取数据等操作，平台运行该操作，结果反馈到下一步。
托管容器工作空间：提供隔离的执行环境，具备文件系统用于输入输出、可选的SQLite等结构化存储，以及受限制的网络访问。

智能体工作流的执行机制

一个高效的智能体工作流始于紧密的执行循环。模型提出动作建议，平台在隔离环境中运行，结果用于后续步骤。以shell工具为例，它展示了模型如何使用工具的一般原理：

在训练期间，模型通过逐步示例学习工具的使用方法和效果。
当模型“使用工具”时，实际上只是提出工具调用建议，无法自行执行调用。
平台负责安全地执行这些调用，确保操作可控且结果可追溯。

早期经验与行业意义

OpenAI分享的初步经验表明，这种环境能够实现更快、更可重复且更安全的生产工作流。对于AI行业而言，这代表着一个关键演进：

降低开发门槛：开发者无需从零构建复杂的基础设施，即可部署具备实际交互能力的智能体。
提升应用范围：从简单的文本生成扩展到数据处理、自动化报告生成等实际业务场景。
强化安全可控：通过隔离环境和受限网络访问，平衡功能性与安全性需求。

随着智能体逐渐成为AI应用的主流形态，OpenAI的这一举措可能推动更多企业采用类似架构，加速AI在复杂任务中的落地进程。

延伸阅读

相关资讯

为什么青少年值得获得安全的AI访问权

OpenAI 推出 GPT-Red：用“超级黑客”大模型训练 AI 安全防线，美国热泵销量逆势增长

热泵在美国为何依然火爆？

Verse：一句提示词，打造你的专属AI员工