远程单次条纹投影轮廓测量中的形状先验捷径:诊断与修复
研究背景
基于学习的单次条纹投影轮廓测量术(FPP)在近距离场景下已取得显著进展,但远程(>1米)应用仍面临挑战:强度随距离平方衰减导致信噪比下降,单次拍摄缺乏条纹阶次信息,且现有网络架构的机制尚未被深入理解。
诊断:模型走“捷径”而非真正解码相位
研究团队通过机械可解释性(MI)和共形不确定性量化(UQ)两种方法,对UNet基线模型进行诊断。在包含15,600张条纹图像、50个物体、距离1.5-2.1米的光照真实合成基准上,最佳UNet基线达到14.54毫米物体平均绝对误差(MAE)。
三项探针实验(线性探针、Grad-CAM、平面外分布测试)一致表明:基线模型并非通过解码条纹相位来求解深度,而是依赖物体边界的形状先验——即通过物体轮廓直接猜测深度,这相当于“作弊”式的捷径学习。
修复:从架构层面消除捷径
研究者提出 PhiCalNet,其核心创新在于不直接回归深度,而是输出包裹相位,再通过一个固定的可微分标定层将相位映射为深度。这一架构设计从根本上移除了形状先验解存在的假设空间,而非通过损失函数惩罚来抑制。
实验显示,物理信息损失函数(将相同物理约束作为软惩罚施加给深度回归网络)并未带来可测量的提升,证明架构本身是决定性因素。PhiCalNet将物体MAE降低了3.3倍,达到4.46毫米;残余误差主要来自±π包裹不连续处的**0.103%**像素。
验证:不确定性量化确认诊断
像素级共形UQ进一步验证了诊断结论:若按快照差异拒绝前5%的物体像素,PhiCalNet的均方根误差(RMSE)降低64%(从20.6毫米降至7.4毫米),而基线仅降低3.5%。MI与UQ两种方法共同指向同一失效模式。
意义与展望
本研究首次系统性地将MI和UQ应用于光学测量网络诊断,证明架构设计比单纯添加物理损失更能引导模型学习正确物理规律。PhiCalNet为远程单次FPP提供了一种有效方案,其“先输出中间物理量、再用固定变换层”的思路,或可推广至其他依赖物理先验的视觉任务。