可解释机器学习实现阿尔茨海默病高精度三分类检测

阿尔茨海默病（AD）影响着全球超过5500万人，早期准确识别正常认知（NC）、轻度认知障碍（MCI）和AD是临床上的迫切需求。近期，一项发表于arXiv的研究利用可解释机器学习方法，基于阿尔茨海默病神经影像学倡议（ADNI）数据集中的八项常规临床评估指标，构建了一个三分类XGBoost模型，实现了近乎完美的检测性能。

研究亮点

该研究从ADNI基线数据中纳入1641名受试者（608名NC、767名MCI、266名AD），选取了MMSE、CDR Global、CDR Sum of Boxes (CDR-SB)、MoCA、FAQ、年龄、性别和教育程度这八个特征。通过Optuna进行超参数优化（50次试验），并使用SMOTE处理类别不平衡问题。

性能表现

在五折交叉验证中，模型平均宏AUC达到0.983（标准差0.007），准确率0.944，宏F10.929。在独立的测试集（247例）上，宏AUC为0.982（95%置信区间：0.965-0.995），准确率0.943，平衡准确率0.932，宏F1 0.927，Cohen's kappa系数高达0.909。这些结果显示了模型卓越的泛化能力。

可解释性分析

研究采用SHAP值进行特征级解释，揭示了不同类别背后的关键驱动因素：

CDR Global 是区分NC和MCI的最重要预测因子；
CDR-SB 和 MMSE 共同主导了AD的分类决策。

这种临床可解释的类特异性特征重要性模式，增强了模型在临床实践中的可信度。

意义与展望

该研究表明，仅利用常规临床评估数据，结合可解释机器学习即可实现高精度的AD三分类检测，为大规模筛查提供了低成本、高可及性的解决方案。未来研究计划引入语音生物标志物，构建多模态检测框架，进一步提升早期诊断能力。

基于可解释机器学习的阿尔茨海默病早期检测：利用ADNI临床生物标志物的多分类研究

研究亮点

性能表现

可解释性分析

意义与展望

延伸阅读

相关资讯