TRUST框架：去中心化AI服务可信审计新范式

随着大推理模型和多智能体系统在高风险领域的广泛应用，如何确保其输出的可靠性与可信度成为关键挑战。传统中心化审计模式存在鲁棒性、可扩展性、透明性和隐私四大短板。近日，研究团队提出TRUST框架，通过三项核心创新构建去中心化AI审计体系：分层有向无环图将思维链推理分解为五个抽象层级，支持并行分布式审计；DAAN协议将多智能体交互投射为因果交互图，实现确定性的根因归责；多层级共识机制结合计算检查器、LLM评估器和人类专家，通过权益加权投票确保在30%恶意节点参与下仍能保证正确性。实验显示，TRUST在多个LLM和基准测试中达到72.4%的审计准确率，较基线提升4-18%，并能抵御20%的节点腐败。DAAN协议在根因归责上达到70%的准确率（传统方法为54-63%），同时节省60%的token消耗。人类研究验证了设计的有效性（F1=0.89，Brier=0.074）。该框架支持去中心化审计、防篡改排行榜、无信任数据标注和受控自主智能体，为推理型AI系统的安全部署铺平道路。

TRUST框架：为去中心化AI服务打造可信审计新范式

延伸阅读

相关资讯