稳定自主控制：工具中介LLM架构实现网络防御

概览

一项新研究提出了一种工具中介的LLM架构，旨在为高风险决策环境下的自主网络防御提供形式化保证。该工作由Kerri Prinos等人完成，论文《Stable Agentic Control: Tool-Mediated LLM Architecture for Autonomous Cyber Defense》已提交至arXiv。

核心问题：自主防御的稳定性缺口

安全运营中心（SOC）在对抗压力下配置端点检测与响应（EDR）策略时，现有智能体系统缺乏形式化保证。传统LLM智能体虽能灵活决策，但其非确定性行为在对抗环境中可能引发不可控风险。研究团队试图回答：如何在不牺牲LLM创造性探索能力的前提下，确保系统稳定性？

技术方案：工具中介架构

架构核心是让LLM智能体通过确定性工具与环境交互，包括Stackelberg最佳响应、贝叶斯观测器更新、攻击图原语等。智能体从工具输出接口强制执行的有限动作目录中选择行为，从而将非确定性限制在安全边界内。

关键创新在于复合Lyapunov函数，该函数在Lean 4中通过机器验证（零"sorry"），证明了系统的可控性、非对称传感器数据的可观测性，以及对抗智能扰动下的输入-状态稳定性（ISS）。两个推论进一步将证书扩展至目录中的任意控制器或对手。

实验验证：显著效果与稳定性

在282个真实企业攻击图上，所有稳定性声明均通过验证。在攻防遥测数据上，Claude Sonnet 4控制器相比确定性贪婪基线，将攻击者预期收益（游戏值）降低59%，且40次运行（4种温度）中方差为零。Claude Haiku 4.5控制器虽收敛至次优游戏值，但在额外40次运行中始终保持在目录边界内，证明架构稳定性不依赖控制器能力。

行业意义

该工作为自主网络防御提供了可验证的安全性基础。工具中介架构将LLM的创造性用于策略探索，同时通过形式化方法保证系统稳定，有望在SOC自动化、EDR策略优化等场景落地。未来，类似方法或可扩展至其他高风险自主决策领域。

稳定自主控制：工具中介的LLM架构实现自主网络防御

概览

核心问题：自主防御的稳定性缺口

技术方案：工具中介架构

实验验证：显著效果与稳定性

行业意义

延伸阅读

相关资讯