稳定自主控制:工具中介的LLM架构实现自主网络防御
概览
一项新研究提出了一种工具中介的LLM架构,旨在为高风险决策环境下的自主网络防御提供形式化保证。该工作由Kerri Prinos等人完成,论文《Stable Agentic Control: Tool-Mediated LLM Architecture for Autonomous Cyber Defense》已提交至arXiv。
核心问题:自主防御的稳定性缺口
安全运营中心(SOC)在对抗压力下配置端点检测与响应(EDR)策略时,现有智能体系统缺乏形式化保证。传统LLM智能体虽能灵活决策,但其非确定性行为在对抗环境中可能引发不可控风险。研究团队试图回答:如何在不牺牲LLM创造性探索能力的前提下,确保系统稳定性?
技术方案:工具中介架构
架构核心是让LLM智能体通过确定性工具与环境交互,包括Stackelberg最佳响应、贝叶斯观测器更新、攻击图原语等。智能体从工具输出接口强制执行的有限动作目录中选择行为,从而将非确定性限制在安全边界内。
关键创新在于复合Lyapunov函数,该函数在Lean 4中通过机器验证(零"sorry"),证明了系统的可控性、非对称传感器数据的可观测性,以及对抗智能扰动下的输入-状态稳定性(ISS)。两个推论进一步将证书扩展至目录中的任意控制器或对手。
实验验证:显著效果与稳定性
在282个真实企业攻击图上,所有稳定性声明均通过验证。在攻防遥测数据上,Claude Sonnet 4控制器相比确定性贪婪基线,将攻击者预期收益(游戏值)降低59%,且40次运行(4种温度)中方差为零。Claude Haiku 4.5控制器虽收敛至次优游戏值,但在额外40次运行中始终保持在目录边界内,证明架构稳定性不依赖控制器能力。
行业意义
该工作为自主网络防御提供了可验证的安全性基础。工具中介架构将LLM的创造性用于策略探索,同时通过形式化方法保证系统稳定,有望在SOC自动化、EDR策略优化等场景落地。未来,类似方法或可扩展至其他高风险自主决策领域。