SheepNav
新上线今天0 投票

KG-TRACE:神经符号框架为抗菌药物耐药性预测注入生物可解释性

概述

抗菌药物耐药性(AMR)是全球公共卫生的重大威胁。基于全基因组测序(WGS)的AMR预测模型虽已取得高准确率,但往往缺乏对预测结果背后生物学机制的解释能力。近日,一项发表于arXiv的研究提出了KG-TRACE,一种新颖的神经符号(neuro-symbolic)框架,旨在将神经网络的归因与已知的生物学知识相结合,为临床决策提供可验证的审计线索。

核心方法

KG-TRACE的核心创新在于将世界卫生组织(WHO)的突变知识图谱作为结构化生物学约束,整合到神经基因组模型中。具体而言,该框架通过以下步骤实现:

  1. 特征融合:同时提取基因组特征和基于RotatE方法的知识图谱嵌入(KG embeddings)。
  2. 动态加权:引入一个可学习的认知信任门(epistemic trust gate),根据输入样本动态调整神经证据与符号生物学知识之间的权重。
  3. 不确定性处理:当神经证据与知识图谱冲突时,系统会发出“不确定”标记,提示需要实验室复核,从而识别可能的多重耐药性共现伪影

实验验证

研究团队在CRyPTIC结核分枝杆菌队列上对KG-TRACE进行了评估。结果表明:

  • 对于异烟肼耐药性预测,模型取得了AUROC 0.9760的竞争性准确率。
  • 更重要的是,模型在符号覆盖度上表现突出:92.5%的异烟肼耐药预测能够映射到已知的生物学路径。
  • 为了量化这种对齐,作者提出了生物学归因比(Biological Grounding Ratio, BGR),一个衡量神经网络归因与已有生物学知识一致性的数据集级指标。

意义与展望

KG-TRACE的主要价值并不在于预测精度的提升(尽管其精度已具有竞争力),而在于为黑箱模型提供了可解释性。在临床环境中,医生往往需要了解模型为何做出某项预测,而非仅仅得到一个概率值。KG-TRACE通过将预测与具体的基因突变知识关联,建立起一条从数据到临床信任的桥梁。

这一工作也代表了神经符号方法在生物医学领域的典型应用:将数据驱动的深度学习与人类积累的符号知识相结合,既保留神经网络的学习能力,又赋予模型推理和解释的透明度。未来,类似的框架有望在药物发现、精准医疗等领域发挥更大作用。

论文信息:KG-TRACE: A Neuro-Symbolic Framework for Mechanistic Grounding in Antimicrobial Resistance Prediction,arXiv:2606.26179,2026年6月提交。

延伸阅读

  1. 温度归零并非万能:LLM-as-Judge 安全评估中的可重复性困境
  2. 联邦哈希投影潜在因子学习:兼顾隐私、效率与精度的新范式
  3. 线索驱动的洗钱团伙发现:Clue2Group 框架如何缩小AI反洗钱研究与实战的鸿沟
查看原文