SheepNav
新上线今天0 投票

哈佛研究:AI在急诊室诊断准确率超过两位人类医生

一项由哈佛医学院和贝斯以色列女执事医疗中心主导的新研究显示,在急诊室场景下,OpenAI的o1模型在诊断准确率上超越了人类医生。研究发表于《Science》期刊,通过多项实验对比了AI模型与内科医生的诊断能力。

实验设计:真实急诊病例的盲测

研究团队选取了76名进入贝斯以色列急诊室的患者,由两位内科主治医生和OpenAI的o1、4o模型分别提供诊断。随后,另外两位不知情的主治医生对诊断结果进行评估。关键点在于,AI模型接收的信息未经任何预处理,与医生当时从电子病历中获取的数据完全一致。

关键结果:AI在分诊阶段优势显著

在急诊分诊这一信息最不充分、决策最紧迫的环节,o1模型的表现尤为突出:

  • o1模型:在67%的分诊案例中给出了“完全正确或非常接近”的诊断;
  • 人类医生A:准确率为55%;
  • 人类医生B:准确率为50%。

研究指出:“在每个诊断节点上,o1的表现要么优于、要么持平于两位主治医生,且差异在初始分诊阶段最为明显。”

行业意义:AI辅助医疗的潜力与边界

该研究并非首次证明AI在特定医疗任务上的能力,但其真实世界数据零预处理的设计更具说服力。哈佛医学院AI实验室负责人Arjun Manrai表示:“我们几乎测试了所有基准,AI模型超越了以往模型和医生基线。”

然而,研究者也强调,这并不意味着AI可以取代医生。在复杂病例、患者沟通和综合决策方面,人类医生仍不可替代。AI更适合作为辅助工具,在信息有限时提供快速、准确的参考,帮助医生减少误诊和延误。

展望:从实验室到临床的挑战

尽管结果令人振奋,但将AI真正融入急诊流程仍面临挑战:数据隐私、模型泛化能力、医生信任度以及监管审批等。不过,随着o1等模型在推理能力上的进步,AI在医疗领域的应用正从“概念验证”走向“临床辅助”。

延伸阅读

  1. 实测这款Linux笔记本后,我终于明白MacBook为何更胜一筹
  2. 我测试了ChatGPT和Perplexity AI作为CarPlay语音助手——这款更胜一筹
  3. 三十年来,我每天一边听 Phish 一边编程
查看原文