SheepNav
新上线今天0 投票

利用梯度优化与多组注意力神经网络实现逆临界实验设计

核反应堆设计与燃料验证严重依赖临界实验,而实验与目标技术之间的中子学相似性是评估实验有效性的关键。传统上,相似性由相关系数 (c_k) 量化,它捕捉核数据不确定性引起的 (k_\text{eff}) 共享偏差。通常,(c_k \geq 0.9) 被认为是实验足够相似的阈值。然而,设计出满足这一要求的高相似度实验几何构型极具挑战,往往依赖专家经验和大量试错。

近期,一篇发表于 arXiv 的论文(arXiv:2606.04033)提出了一种逆设计方法,利用深度学习与梯度优化自动生成临界实验方案,显著提升了相似度与设计效率。该方法的核心在于:

方法:神经网络替代模型 + 梯度优化

研究者训练了一个深度神经网络作为替代模型,用于预测给定几何构型的灵敏度向量。该网络基于 OpenMC 计算的灵敏度数据,采用 U-Net 卷积编码器-解码器架构,并创新性地引入多组注意力池化层。传统池化方法(如最大池化、平均池化)会丢失空间依赖信息,而多组注意力池化能够捕捉不同能量组下灵敏度分布的空间特征,不仅提升了预测性能,还提供了可解释的内部行为。

替代模型的可微性使得梯度优化得以应用于整个组合设计空间。优化过程直接改变几何网格中每个位置的材料分配,以最大化 (c_k)。这种方法规避了传统搜索算法的离散性和维数灾难问题。

应用案例:TN-LC 运输容器验证

研究将方法应用于 TN-Americas TN-LC 运输容器的验证,该容器使用 HALEU(高丰度低浓缩铀)燃料,现有临界实验数据覆盖极其有限。针对三种感兴趣的构型,优化后的实验几何分别达到了 0.97757、0.81324 和 0.93276 的 (c_k) 分数。其中两种构型远超 0.9 的阈值,第三种虽未达标,但已显著高于现有水平。

意义与展望

这项工作展示了深度学习在核工程逆问题中的巨大潜力。传统临界实验设计周期长、成本高,而基于梯度优化的方法可以快速探索巨大设计空间,自动生成高相似度的实验方案。这不仅加速了新型反应堆与燃料的验证流程,也为未来智能核设计工具奠定了基础。

值得注意的是,该方法目前仍依赖于模拟数据与代理模型的精度。未来工作可进一步扩展至三维几何、考虑更多不确定性来源,并集成到实际实验设计流程中。

延伸阅读

  1. 贝叶斯充分表示:监督学习中的信息保留与损失函数的关系
  2. 自我蒸馏策略梯度:让语言模型自己教自己,强化学习的新突破
  3. Transformer 真的需要三个投影吗?QKV 变体系统研究
查看原文