PathoSage:病理学中的多源证据裁决——经验感知智能体工作流
概述
病理诊断依赖对组织切片中微小形态特征的精确识别,但现有AI系统常因证据冲突或模型幻觉而误判。近日,arXiv上发表的论文《PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow》提出了一种名为PathoSage的三阶段框架,通过显式分离知识检索、证据收集与证据裁决,显著提升了病理学多模态推理的可靠性。
核心创新:结构化证据审议
PathoSage的核心组件是结构化证据审议(Structured Evidence Deliberation)。该机制不再将多个工具的输出简单合并到同一上下文中,而是独立评估来自不同工具(如视觉模型、知识库、分类器)的异质证据,进行冲突分析,并在全新上下文中生成最终判断。这有效减少了锚定偏差(anchoring bias)和上下文污染问题,避免了传统智能体系统因混合证据导致的决策脆弱性。
经验感知:无训练的Beta-Bernoulli系统
PathoSage还引入了一个无需训练的Beta-Bernoulli经验系统,通过连续信用分配来建模工具的长期可靠性。该系统为每个工具维护一个可靠性评分,并基于历史表现构建相似度加权先验,指导未来工具的选择与权重分配。这种设计使智能体能够从过往交互中学习,逐步优化证据整合策略。
实验效果
在病理学视觉问答(VQA)和分类任务上,PathoSage显著缓解了幻觉和分类器分歧问题,性能超越了强基线病理学多模态大模型(MLLM)和现有智能体系统。论文强调,显式的证据裁决与可靠性感知工具建模是构建鲁棒病理学智能体的关键要素。
行业意义
PathoSage为计算病理学提供了一种更透明、更可靠的推理范式。其模块化设计不仅适用于病理学,也可推广至其他需要多源证据融合的医疗AI场景。未来,结合更丰富的工具集和持续学习机制,此类框架有望辅助病理学家做出更精准的诊断决策。