python语义分割opencv 语义分割deeplab

转载

mob6454cc77b8eb 2024-08-31 12:48:54

DeepLab 是结合了深度卷积神经网络（DCNNs）和概率图模型（DenseCRFs）的方法。

在实验中发现 DCNNs 做语义分割时精准度不够的问题，根本原因是 DCNNs 的高级特征的平移不变性，即高层次特征映射，根源于重复的池化和下采样。

针对信号下采样或池化降低分辨率，DeepLab 采用的空洞卷积算法扩展感受野，获取更多的语境信息。

采用完全连接的条件随机场（CRF）提高模型捕获细节的能力，简单来说，就是对一个像素进行分类的时候，不仅考虑DCNN的输出，而且考虑该像素点周围像素点的值，这样语义分割结果边界清楚。

除空洞卷积和 CRFs 之外，论文使用的 tricks 还有 Multi-Scale features，与FCN skip layer类似，具体实现上，在输入图片与前四个 max pooling 后添加卷积层，这四个预测结果和模型输出拼接。

模型流程：

python语义分割opencv 语义分割deeplab_python语义分割opencv

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs DCNN 连续池化和下采样造成分辨率降低，DeepLabv2 在最后几个最大池化层中去除下采样，取而代之的是使用空洞卷积，以更高的采样密度计算特征映射。

基于 Spatial Pyramid Pooling (SPP) ，在给定的输入上以不同采样率的空洞卷积并行采样，相当于以多个比例捕捉图像的上下文，该论文称为 ASPP (atrous spatial pyramid pooling) 模块。

关于条件随机场，DeepLabv2 是采样全连接的 CRF 在增强模型捕捉细节的能力

问题：特征分辨率的降低、物体存在多尺度，DCNN 的平移不变性。

系统流程：

python语义分割opencv 语义分割deeplab_卷积_02