CAMP框架：AI临床预测实现病例自适应多智能体会诊

临床AI预测的困境与突破

当大型语言模型（LLM）应用于临床预测时，研究人员发现一个显著问题：病例级别的异质性。简单病例通常能获得一致、可靠的预测结果，而复杂病例则表现出高度敏感性——即使提示词（prompt）的微小变化，也可能导致预测结果的显著分歧。这种不稳定性在医疗场景中尤为危险，因为错误的诊断可能带来严重后果。

传统的解决方案主要分为两类：单智能体策略从单一角色条件分布中采样，缺乏多视角分析；而多智能体框架虽然引入了多个角色，但通常采用固定的专家配置和平板的多数投票机制，忽略了不同意见中蕴含的诊断信号。

CAMP：病例自适应多智能体会诊框架

针对上述问题，研究团队提出了 CAMP（Case-Adaptive Multi-agent Panel） 框架。该框架的核心创新在于模拟真实医疗会诊流程：

动态专家小组组建：一个“主治医师”智能体根据每个病例的诊断不确定性，动态组建一个由专科医生组成的专家小组。这意味着不同复杂度的病例会匹配不同专业背景的专家组合，而非“一刀切”的固定团队。
三值投票机制：每位专家通过 KEEP（采纳）/REFUSE（拒绝）/NEUTRAL（中立） 三种选项对候选诊断进行投票。这允许专家在超出自身专业领域时进行“原则性弃权”，避免了外行强行判断的风险。
混合路由决策：CAMP采用三层决策机制：
1. 强共识路径：当专家意见高度一致时直接采纳。
2. 主治医师后备判断：当共识不足时，由主治医师智能体做出最终判断。
3. 基于证据的仲裁：在争议情况下，系统会权衡论证质量而非单纯依赖票数，进行更精细的裁决。

性能表现与行业意义

在基于MIMIC-IV数据集进行的诊断预测和简短住院病程生成测试中，CAMP在四种不同的LLM骨干模型上均持续优于现有基线方法。值得注意的是，它在实现更高准确性的同时，消耗的token数量比大多数竞争性多智能体方法更少，体现了更高的效率。

透明决策审计是CAMP的另一大优势。完整的投票记录和仲裁轨迹为每个诊断决策提供了可追溯的解释，这对于医疗AI的合规性、可信度和临床落地至关重要。

对AI医疗行业的启示

CAMP框架的提出，标志着AI在临床决策支持领域从“静态工具”向“动态协作系统”的演进。它不仅仅是一个技术优化，更是一种方法论上的转变：

承认不确定性：系统明确区分简单与复杂病例，并针对性地分配计算和认知资源。
模拟人类协作：通过多智能体分工与仲裁机制，更贴近真实医疗团队的会诊模式。
平衡效率与精度：在提升预测可靠性的同时，控制了计算成本，为实际部署扫清障碍。

随着医疗AI逐步从辅助筛查走向更复杂的诊断和预后预测，像CAMP这样注重适应性、透明性和人机协作逻辑的框架，很可能成为下一代临床决策系统的标准架构之一。其核心思想——即“没有一套专家组合适合所有病例”——或许也将启发其他高风险领域的AI应用设计。

AI临床预测新突破：CAMP框架实现病例自适应多智能体会诊

临床AI预测的困境与突破

CAMP：病例自适应多智能体会诊框架

性能表现与行业意义

对AI医疗行业的启示

延伸阅读

相关资讯