OpenAI o1 急诊诊断准确率 67% 超越人类医生

快讯：AI 诊断能力再获突破，急诊场景下表现亮眼

一项最新研究显示，OpenAI 的 o1 模型在急诊患者诊断测试中的准确率达到了 67%，而人类分诊医生的准确率仅为 50-55%。这一结果来自对真实急诊病例的模拟评估，标志着 AI 在医疗诊断领域迈出了重要一步。

研究设计：研究人员将急诊科的真实病例输入 o1 模型，要求其根据患者初始信息（如主诉、生命体征、初步检查结果）给出诊断结论，并与分诊医生的实际诊断进行对比。
核心数据：o1 模型正确诊断了 67% 的病例，而人类医生的平均准确率在 50% 至 55% 之间，差距超过 10 个百分点。
场景特殊性：急诊分诊环境时间紧迫、信息有限，医生往往需要在短时间内做出高风险决策。AI 在此类“高压”场景下的优势可能更为明显。

急诊分诊是医疗体系中最关键的环节之一。误诊可能导致治疗延误、资源错配甚至患者死亡。o1 模型超越人类的表现意味着：

尽管结果令人振奋，但研究者也指出：

OpenAI 的 o1 模型属于推理增强型语言模型，其设计初衷是解决复杂逻辑和推理问题。此次在医疗诊断上的成功，验证了“推理能力”在专业领域的泛化价值。

此前，AI 在医学影像分析（如 X 光片、病理切片）中已取得显著进展，但 文本型诊断推理（如根据患者主诉和检查结果进行鉴别诊断）一直是难点。o1 的突破表明，大语言模型正在从“信息检索”向“临床推理”迈进。

该研究为 AI 辅助急诊分诊提供了有力证据。下一步，研究人员计划：

如果后续研究证实其可靠性与安全性，我们可能在不久的将来看到 AI 成为急诊科的“标配”助手。