PSM 匹配之后回归

转载

智能探索者之家 2024-07-09 06:44:40

文章标签 PSM 匹配之后回归计算机视觉深度学习 3D 深度图 文章分类 机器学习人工智能

PSMNET,全称Pyramid Stereo Matching Network是一篇2018发表在CVPR上的双目立体匹配论文。论文的作者是Department of Computer Science, National Chiao Tung University的Jia-Ren Chang。该篇论文融合了之前一些论文的相关研究并做了一些创新。相比于之前的网络，该网络集成了更多的全局上下文信息。对一些病态区域如遮挡区域、重复图案、无纹理和反光表面，相较于之前的网络展现了更好的鲁棒性。

文章目录

一、主要贡献
二、网络结构
三、SPP(Spatial Pyramid Pooling Module)
四、Cost Volume的构建
五、3D CNN
六、深度回归
六、实验
七、总结

一、主要贡献

提出了一种不要后处理的端到端的立体匹配网络。
引入了一个金字塔池化模块，用于将全局上下文信息整合到图像特征中。
提出了一个堆叠的沙漏 3D CNN 来扩展成本量中上下文信息的区域支持。
在 KITTI 数据集上实现了最先进的精度。

二、网络结构

PSM 匹配之后回归_3D

三、SPP(Spatial Pyramid Pooling Module)

在对左右图的视差进行匹配的过程中，单纯使用像素点的强弱进行对应像素点的匹配是困难的。因此，如果提取到的图像的特征包含丰富的上下文的信息就能更好的估计深度，尤其是对病态区域。但是由于经验感受野远小于深度网络中的理论感受野。金字塔池化的方法被提出来来改善这样的问题。在SSP的设计中作者借鉴了语义分割中集成高低维度特征的方法，提出了多尺度的上下文增强方法。

在本文中作者使用了4个固定尺寸的平均池化块分别大小6464，3232，1616和88 并接上了1*1卷积和上采样，最后把多个feature map concat在了一起。最后在消融实验中证明了这种设计方法的有效性。

PSM 匹配之后回归_深度图_02