KG-TRACE：神经符号框架提升AMR预测可解释性

概述

抗菌药物耐药性（AMR）是全球公共卫生的重大威胁。基于全基因组测序（WGS）的AMR预测模型虽已取得高准确率，但往往缺乏对预测结果背后生物学机制的解释能力。近日，一项发表于arXiv的研究提出了KG-TRACE，一种新颖的神经符号（neuro-symbolic）框架，旨在将神经网络的归因与已知的生物学知识相结合，为临床决策提供可验证的审计线索。

核心方法

KG-TRACE的核心创新在于将世界卫生组织（WHO）的突变知识图谱作为结构化生物学约束，整合到神经基因组模型中。具体而言，该框架通过以下步骤实现：

特征融合：同时提取基因组特征和基于RotatE方法的知识图谱嵌入（KG embeddings）。
动态加权：引入一个可学习的认知信任门（epistemic trust gate），根据输入样本动态调整神经证据与符号生物学知识之间的权重。
不确定性处理：当神经证据与知识图谱冲突时，系统会发出“不确定”标记，提示需要实验室复核，从而识别可能的多重耐药性共现伪影。

实验验证

研究团队在CRyPTIC结核分枝杆菌队列上对KG-TRACE进行了评估。结果表明：

对于异烟肼耐药性预测，模型取得了AUROC 0.9760的竞争性准确率。
更重要的是，模型在符号覆盖度上表现突出：92.5%的异烟肼耐药预测能够映射到已知的生物学路径。
为了量化这种对齐，作者提出了生物学归因比（Biological Grounding Ratio, BGR），一个衡量神经网络归因与已有生物学知识一致性的数据集级指标。

意义与展望

KG-TRACE的主要价值并不在于预测精度的提升（尽管其精度已具有竞争力），而在于为黑箱模型提供了可解释性。在临床环境中，医生往往需要了解模型为何做出某项预测，而非仅仅得到一个概率值。KG-TRACE通过将预测与具体的基因突变知识关联，建立起一条从数据到临床信任的桥梁。

这一工作也代表了神经符号方法在生物医学领域的典型应用：将数据驱动的深度学习与人类积累的符号知识相结合，既保留神经网络的学习能力，又赋予模型推理和解释的透明度。未来，类似的框架有望在药物发现、精准医疗等领域发挥更大作用。

论文信息：KG-TRACE: A Neuro-Symbolic Framework for Mechanistic Grounding in Antimicrobial Resistance Prediction，arXiv:2606.26179，2026年6月提交。

KG-TRACE：神经符号框架为抗菌药物耐药性预测注入生物可解释性

概述

核心方法

实验验证

意义与展望

延伸阅读

相关资讯