新上线今天0 投票
KG-TRACE:神经符号框架为抗菌药物耐药性预测注入生物可解释性
概述
抗菌药物耐药性(AMR)是全球公共卫生的重大威胁。基于全基因组测序(WGS)的AMR预测模型虽已取得高准确率,但往往缺乏对预测结果背后生物学机制的解释能力。近日,一项发表于arXiv的研究提出了KG-TRACE,一种新颖的神经符号(neuro-symbolic)框架,旨在将神经网络的归因与已知的生物学知识相结合,为临床决策提供可验证的审计线索。
核心方法
KG-TRACE的核心创新在于将世界卫生组织(WHO)的突变知识图谱作为结构化生物学约束,整合到神经基因组模型中。具体而言,该框架通过以下步骤实现:
- 特征融合:同时提取基因组特征和基于RotatE方法的知识图谱嵌入(KG embeddings)。
- 动态加权:引入一个可学习的认知信任门(epistemic trust gate),根据输入样本动态调整神经证据与符号生物学知识之间的权重。
- 不确定性处理:当神经证据与知识图谱冲突时,系统会发出“不确定”标记,提示需要实验室复核,从而识别可能的多重耐药性共现伪影。
实验验证
研究团队在CRyPTIC结核分枝杆菌队列上对KG-TRACE进行了评估。结果表明:
- 对于异烟肼耐药性预测,模型取得了AUROC 0.9760的竞争性准确率。
- 更重要的是,模型在符号覆盖度上表现突出:92.5%的异烟肼耐药预测能够映射到已知的生物学路径。
- 为了量化这种对齐,作者提出了生物学归因比(Biological Grounding Ratio, BGR),一个衡量神经网络归因与已有生物学知识一致性的数据集级指标。
意义与展望
KG-TRACE的主要价值并不在于预测精度的提升(尽管其精度已具有竞争力),而在于为黑箱模型提供了可解释性。在临床环境中,医生往往需要了解模型为何做出某项预测,而非仅仅得到一个概率值。KG-TRACE通过将预测与具体的基因突变知识关联,建立起一条从数据到临床信任的桥梁。
这一工作也代表了神经符号方法在生物医学领域的典型应用:将数据驱动的深度学习与人类积累的符号知识相结合,既保留神经网络的学习能力,又赋予模型推理和解释的透明度。未来,类似的框架有望在药物发现、精准医疗等领域发挥更大作用。
论文信息:KG-TRACE: A Neuro-Symbolic Framework for Mechanistic Grounding in Antimicrobial Resistance Prediction,arXiv:2606.26179,2026年6月提交。