SheepNav
新上线14天前0 投票

解读细胞,设计药物:基于扰动条件分子扩散的功能导向药物设计

从转录组到分子:一种全新的药物设计范式

传统药物研发往往依赖于已知的靶点蛋白三维结构,但许多疾病(如复杂神经退行性疾病或癌症)的靶点结构难以获得,或表型源于多条信号通路的失调。在此背景下,一项来自中科院等机构的研究提出了转录组药物设计(TBDD)框架,将药物发现重新定义为生成式逆问题:根据期望的转录组状态转变来设计药物分子。

挑战:跨模态鸿沟与数据稀疏性

该研究指出,TBDD本质上是一个病态问题——相同的转录组变化可能对应多种分子结构,而生物学与化学之间巨大的“领域鸿沟”以及转录组信号的高稀疏性,使得直接学习映射关系极为困难。现有方法往往忽略这些挑战,导致生成分子在功能一致性上表现欠佳。

CURE框架:多分辨率转录组引导扩散模型

为解决上述难题,团队提出了CURE(Cellular Response Engine),一种多分辨率转录组引导的扩散模型。其核心组件是转录组扰动功能特征提取器(TFE),它包含三个关键步骤:

  1. 功能导向扰动嵌入:从药物处理前后的转录组状态中提取与功能相关的特征表示;
  2. 跨模态对齐:将这些生物学特征与化学分子视图(如分子图、SMILES序列)进行对齐,弥合生物-化学鸿沟;
  3. 异质性感知聚合:从噪声转录组数据中提取稳健的状态特异性信号,降低批次效应和个体差异的影响。

实验结果:结构质量与功能一致性双提升

在标准基准测试和严格的分布外(OOD)协议下,CURE在分子结构质量(如有效性、新颖性)和功能一致性(如转录组预测匹配度)上均显著优于现有基线模型。此外,研究团队通过一个零样本基因抑制剂设计任务验证了其实用价值——模型无需针对特定基因重新训练,即可直接生成能抑制该基因表达的候选分子,展示了表型驱动生成发现的潜力。

行业意义:当AI开始“读”细胞

这项研究标志着AI药物设计从“结构导向”迈向“功能导向”的关键一步。传统基于结构的药物设计(SBDD)受限于靶点结构数据,而转录组数据在公共数据库中大量积累(如LINCS、CMap项目)。CURE框架有望利用这些数据,在靶点未知或通路复杂的情况下加速先导化合物发现。

不过,该研究仍处于理论验证阶段,其生成分子的实际药效和毒性仍需湿实验验证。未来,如何将转录组动态变化与多模态数据(如蛋白质组、代谢组)融合,将是提升模型泛化能力的重要方向。

延伸阅读

  1. NumLeak:公开数值基准竟成基础模型“潜标签”,前沿大模型记忆能力惊人
  2. MADQI:面向AIS船舶异常检测的无监督学习新评估指标
  3. 突破 fMRI 数据瓶颈:双谱流匹配模型生成高保真脑功能时序数据
查看原文