远程单次条纹投影轮廓测量：诊断与修复形状先验捷径

研究背景

基于学习的单次条纹投影轮廓测量术（FPP）在近距离场景下已取得显著进展，但远程（>1米）应用仍面临挑战：强度随距离平方衰减导致信噪比下降，单次拍摄缺乏条纹阶次信息，且现有网络架构的机制尚未被深入理解。

研究团队通过机械可解释性（MI）和共形不确定性量化（UQ）两种方法，对UNet基线模型进行诊断。在包含15,600张条纹图像、50个物体、距离1.5-2.1米的光照真实合成基准上，最佳UNet基线达到14.54毫米物体平均绝对误差（MAE）。

三项探针实验（线性探针、Grad-CAM、平面外分布测试）一致表明：基线模型并非通过解码条纹相位来求解深度，而是依赖物体边界的形状先验——即通过物体轮廓直接猜测深度，这相当于“作弊”式的捷径学习。

研究者提出 PhiCalNet，其核心创新在于不直接回归深度，而是输出包裹相位，再通过一个固定的可微分标定层将相位映射为深度。这一架构设计从根本上移除了形状先验解存在的假设空间，而非通过损失函数惩罚来抑制。

实验显示，物理信息损失函数（将相同物理约束作为软惩罚施加给深度回归网络）并未带来可测量的提升，证明架构本身是决定性因素。PhiCalNet将物体MAE降低了3.3倍，达到4.46毫米；残余误差主要来自±π包裹不连续处的**0.103%**像素。

像素级共形UQ进一步验证了诊断结论：若按快照差异拒绝前5%的物体像素，PhiCalNet的均方根误差（RMSE）降低64%（从20.6毫米降至7.4毫米），而基线仅降低3.5%。MI与UQ两种方法共同指向同一失效模式。

本研究首次系统性地将MI和UQ应用于光学测量网络诊断，证明架构设计比单纯添加物理损失更能引导模型学习正确物理规律。PhiCalNet为远程单次FPP提供了一种有效方案，其“先输出中间物理量、再用固定变换层”的思路，或可推广至其他依赖物理先验的视觉任务。