多模态AI从心电图精准诊断左心室射血分数四分类

心力衰竭是全球主要死因之一，而左心室射血分数（LVEF）是评估心脏泵血功能的核心指标。 传统上，LVEF的测定依赖超声心动图，这在基层医疗和资源匮乏地区往往难以普及。近日，来自哈佛医学院和Hartford HealthCare的研究团队在arXiv上发表了一项突破性研究，提出了一种多模态机器学习框架，仅通过常规12导联心电图（ECG）和结构化电子健康记录（EHR）数据，即可将LVEF分为四个临床常用等级，准确率媲美甚至超越单一模态方法。

研究背景与核心挑战

LVEF的精确分级对于心衰治疗决策至关重要，例如射血分数保留的心衰（HFpEF）与射血分数降低的心衰（HFrEF）在用药方案上存在显著差异。然而，超声心动图设备昂贵、操作依赖专业人员，导致许多患者无法及时获得评估。心电图虽然普及且成本低廉，但传统上仅用于心律和缺血诊断，难以直接量化心脏功能。

多模态框架设计

研究团队构建了一个融合ECG时序特征与EHR结构化变量的多模态模型。具体而言：

ECG特征：从12导联心电信号中提取了包括QRS波群宽度、QT间期、ST段变化等工程化时序特征；
EHR变量：包括年龄、性别、血压、合并症（如糖尿病、高血压）及用药记录等。

模型采用XGBoost作为分类器，将LVEF分为四类：正常（>50%）、轻度降低（40-50%）、中度降低（30-40%） 和 重度降低（<30%）。同时，通过SHAP归因方法实现了模型可解释性，识别出对分类贡献最大的特征。

数据与性能表现

研究使用了来自Hartford HealthCare的回顾性数据，包含36,784对ECG-超声心动图记录（来自30,952名门诊患者），并采用时间分割验证：训练集来自较早时间段，测试集来自后续19,966份ECG，以评估模型的时序泛化能力。

结果显示，多模态模型在“一对一其余”的ROC曲线下面积（AUROC）上表现优异：

重度降低：0.95
中度降低：0.92
轻度降低：0.82
正常：0.91

相比之下，仅使用ECG或仅使用EHR的基线模型AUROC均低于0.90，证明多模态融合显著提升了分类性能。重要的是，在时间验证集上模型性能保持稳定，表明其具有临床部署的鲁棒性。

临床意义与未来方向

这项研究为低成本、可扩展的心衰筛查提供了新思路。在基层诊所或资源有限地区，医生可仅通过心电图和基本病历即可快速识别高危患者，优先安排超声确认，从而优化医疗资源分配。此外，模型的可解释性有助于临床医生理解预测依据，增强信任感。

研究团队指出，未来工作将探索模型在真实世界前瞻性队列中的验证，并整合更多非侵入性生物标志物（如可穿戴设备数据）以进一步提升精度。同时，如何将模型部署到现有电子病历系统中也是重要课题。

小结

该研究展示了多模态机器学习在心血管诊断中的巨大潜力，将普及的心电图与结构化临床数据结合，实现了堪比超声的LVEF分级能力。这不仅可能改变心衰的筛查范式，也为其他依赖昂贵影像的疾病提供了可借鉴的AI诊断路径。

多模态可解释机器学习：从心电图精准诊断左心室射血分数四分类

研究背景与核心挑战

多模态框架设计

数据与性能表现

临床意义与未来方向

小结

延伸阅读

相关资讯