介绍一篇通过无监督depth estimation改进语义分割的论文_sed

作者丨黄浴@知乎

编辑丨3D视觉工坊

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_02

arXiv12月19号苏黎世ETH的上传论文“Three Ways to Improve Semantic Segmentation with Self-Supervised Depth Estimation“:

介绍一篇通过无监督depth estimation改进语义分割的论文_微信_03

分割需要标注数据的工作很麻烦。本文是semi-supervised方法,其中采用自监督的单目深度估计结果来增强,即auxiliary task。(1)深度估计的特征学习知识迁移到语义分割任务;(2)采用的data augmentation很强,即DepthMix,将标记和图像基于景物结构进行混合;(3)depth特征的diversity和“学生-老师”框架的depth学习难度,有助于选择有用特征做语义分割的标注,即Unsupervised Data Selection for Annotation,其选择的标准是diversity和uncertainty。

作者给出开源代码:​https://github.com/lhoyer/improving_segmentation_with_selfsupervised_depth​

Active learning是有助于减少标注负担的方法。一是uncertainty-based,另一个是diversity-based。

如下是非监督数据选择的算法伪代码:

介绍一篇通过无监督depth estimation改进语义分割的论文_3d_04

diversity sampling公式:

介绍一篇通过无监督depth estimation改进语义分割的论文_3d_05

uncertainty sampling公式:

介绍一篇通过无监督depth estimation改进语义分割的论文_微信_06

介绍一篇通过无监督depth estimation改进语义分割的论文_微信_07

DepthMix的公式:两幅图像加一个来自depth的Mask(即近目标能够遮挡远目标)

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_08

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_09

整个半监督的语义分割框架如图:其中SDE(selfsupervised depth estimation)作为辅助任务。LD是SDE的depth loss函数项,LF是特征距离项(避免特征遗忘),而segmentation的训练是基于pixel-wise cross entropy函数Lce。

介绍一篇通过无监督depth estimation改进语义分割的论文_微信_10

depth预训练的loss函数:

介绍一篇通过无监督depth estimation改进语义分割的论文_3d_11

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_12介绍一篇通过无监督depth estimation改进语义分割的论文_3d_13

注:图中的depth decoder得到的fD,可做semantic decoder输出fS的初始化。

无标注图像的学习,是通过一个mean teacher算法产生伪标记,即对语义分割模型的weight采用exponential moving average,类似temporal ensemble

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_14

介绍一篇通过无监督depth estimation改进语义分割的论文_sed_15

整个标记样本和伪标记样本做分割训练的loss函数是

介绍一篇通过无监督depth estimation改进语义分割的论文_3d_16

加入DepthMix样本S‘即把标注和伪标注的样本组合,取代非标注样本,新的loss函数即

介绍一篇通过无监督depth estimation改进语义分割的论文_3d_17

实验结果:

介绍一篇通过无监督depth estimation改进语义分割的论文_微信_18介绍一篇通过无监督depth estimation改进语义分割的论文_微信_19

本文仅做学术分享,如有侵权,请联系删文。


介绍一篇通过无监督depth estimation改进语义分割的论文_sed_20

▲长按关注公众号