新上线今天0 投票
哈佛研究:AI在急诊室诊断准确率超过两位人类医生
一项由哈佛医学院和贝斯以色列女执事医疗中心主导的新研究显示,在急诊室场景下,OpenAI的o1模型在诊断准确率上超越了人类医生。研究发表于《Science》期刊,通过多项实验对比了AI模型与内科医生的诊断能力。
实验设计:真实急诊病例的盲测
研究团队选取了76名进入贝斯以色列急诊室的患者,由两位内科主治医生和OpenAI的o1、4o模型分别提供诊断。随后,另外两位不知情的主治医生对诊断结果进行评估。关键点在于,AI模型接收的信息未经任何预处理,与医生当时从电子病历中获取的数据完全一致。
关键结果:AI在分诊阶段优势显著
在急诊分诊这一信息最不充分、决策最紧迫的环节,o1模型的表现尤为突出:
- o1模型:在67%的分诊案例中给出了“完全正确或非常接近”的诊断;
- 人类医生A:准确率为55%;
- 人类医生B:准确率为50%。
研究指出:“在每个诊断节点上,o1的表现要么优于、要么持平于两位主治医生,且差异在初始分诊阶段最为明显。”
行业意义:AI辅助医疗的潜力与边界
该研究并非首次证明AI在特定医疗任务上的能力,但其真实世界数据和零预处理的设计更具说服力。哈佛医学院AI实验室负责人Arjun Manrai表示:“我们几乎测试了所有基准,AI模型超越了以往模型和医生基线。”
然而,研究者也强调,这并不意味着AI可以取代医生。在复杂病例、患者沟通和综合决策方面,人类医生仍不可替代。AI更适合作为辅助工具,在信息有限时提供快速、准确的参考,帮助医生减少误诊和延误。
展望:从实验室到临床的挑战
尽管结果令人振奋,但将AI真正融入急诊流程仍面临挑战:数据隐私、模型泛化能力、医生信任度以及监管审批等。不过,随着o1等模型在推理能力上的进步,AI在医疗领域的应用正从“概念验证”走向“临床辅助”。