新上线今天0 投票
全国性EHR数据助力慢性鼻窦炎预测:分层模型提升早期识别能力
慢性鼻窦炎(CRS)是一种常见的异质性炎症性疾病,导致显著的发病率和医疗成本。由于症状与过敏性鼻炎等常见疾病重叠,且表型多样,早期识别极为困难。此前预测研究多依赖单一机构队列,缺乏人群层面的泛化能力。
为解决这一问题,研究团队利用美国国立卫生研究院“All of Us”研究项目的全国性纵向电子健康记录数据,基于患者确诊前两年的病史预测CRS诊断。面对编码EHR数据中特征稀疏和维度极高(约11万个候选编码)的挑战,他们设计了一种混合特征选择流程,结合基于患病率的统计筛选与基于模型的重要性排序,最终将特征压缩至100个可解释的变量。
为了捕捉不同人口群体的异质性,研究针对六个成年性别-生命阶段亚组训练了分层模型,并进行亚组特定的超参数调优。最终框架的整体AUC达到0.8461,较最佳基线提升0.0168。
关键结论:该研究证明了常规收集的EHR数据能够支持具有人群代表性的CRS风险分层,有望在初级保健中实现更早的分诊和转诊优先级排序。论文已被IEEE EMBC 2026接收,共同第一作者为Sicong Chang和Yidan Shen。

