精选今天0 投票
TRUST框架:为去中心化AI服务打造可信审计新范式
随着大推理模型和多智能体系统在高风险领域的广泛应用,如何确保其输出的可靠性与可信度成为关键挑战。传统中心化审计模式存在鲁棒性、可扩展性、透明性和隐私四大短板。近日,研究团队提出TRUST框架,通过三项核心创新构建去中心化AI审计体系:分层有向无环图将思维链推理分解为五个抽象层级,支持并行分布式审计;DAAN协议将多智能体交互投射为因果交互图,实现确定性的根因归责;多层级共识机制结合计算检查器、LLM评估器和人类专家,通过权益加权投票确保在30%恶意节点参与下仍能保证正确性。实验显示,TRUST在多个LLM和基准测试中达到72.4%的审计准确率,较基线提升4-18%,并能抵御20%的节点腐败。DAAN协议在根因归责上达到70%的准确率(传统方法为54-63%),同时节省60%的token消耗。人类研究验证了设计的有效性(F1=0.89,Brier=0.074)。该框架支持去中心化审计、防篡改排行榜、无信任数据标注和受控自主智能体,为推理型AI系统的安全部署铺平道路。