微软推出新标准,让开发者更精准控制AI代理行为
随着AI代理能力不断增强,企业在将其部署到各种应用、工作流和产品中时,面临一个新挑战:如何确保代理在不同环境下按预期行动。微软正通过一项名为 Agent Control Specification (ACS) 的新开源标准来解决这一问题,旨在为开发者提供更一致、更细粒度的方式来控制AI代理的允许行为。
ACS本质上允许开发者、合规和安全团队为代理定义自己的策略。这些规则可以规定代理可以做什么、禁止做什么、何时需要人工审批操作,以及应记录哪些证据供后续审查。当代理执行任务时,策略文件会在多个拦截点被检查,确保其不越界。
当前,开发者通常通过系统提示词、应用代码中的自定义检查或分类器来管控AI行为,但这些方法往往导致控制碎片化,难以审计和跨框架复用。ACS将这些控制整合到一个通用治理层中。微软表示,该规范可在代理工作流的多个节点检查其是否遵守护栏——包括接收输入前、调用工具前、工具返回结果后以及最终响应发送给用户前。策略可以允许、阻止操作,编辑敏感信息,甚至请求人工批准。开发者还可以插入输入输出分类器、用LLM作为策略裁判,以及检查工具调用、工具选择、输入准确性、输出使用和响应的逻辑。
由于这些策略可以写成单个文件,因此可以随代理一起打包,使安全策略能跨不同框架和环境跟随代理。ACS现以SDK形式发布,并提供了针对LangChain、OpenAI Agents SDK和Anthropic Agents SDK的插件。
行业背景与意义
AI代理的自主性提升带来了新的治理需求。工具误用或意外操作可能导致级联故障,企业急需标准化的控制手段。ACS的推出填补了这一空白,它将分散的控制点统一为可移植的策略文件,降低了合规风险,也使得代理行为更可预测。对于采用多框架的企业而言,ACS的跨平台特性尤为关键——策略可以一次定义,随处执行。
小结
微软ACS为AI代理治理提供了一种标准化、可扩展的方案。通过将安全策略与代理捆绑,企业可以在不牺牲灵活性的前提下,实现对代理行为的精细化管控。这一举措有望推动AI代理在企业级应用中的安全落地。