欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
图像分割作为计算机视觉的基础任务之一,应用非常广泛,今天给大家推荐初学深度学习图像分割必读的一些文章。
作者&编辑 | 言有三
1 FCN
Fully Convolutional Network(FCN)作为公认的卷积神经网络用于图像分割任务的鼻祖,当然是入门首选。
文章引用量:10000+
推荐指数:✦✦✦✦✦
[1] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 3431-3440.
2 UNet与SegNet
UNet和SegNet两个模型都是对称的编解码结构,与FCN是同一时期的图像分割模型,都是最经典的网络架构之一。
文章引用量:7000+
推荐指数:✦✦✦✦✦
[2] Badrinarayanan V, Kendall A, Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(12): 2481-2495.
[3] Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation[C]//International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015: 234-241.
3 DenseCRF与Deeplab
在深度学习应用于图像分割之前,基于CRF的Graph Cuts(图割)算法才是王者。
Deeplab[5]将DenseCRF[4]应用于分割结果的后处理改进,CRFasRNN[6]则将其直接融合到CNN模型中。
其中,在Deeplab中还在图像分割网络中使用了带孔卷积,文[7]则首次在网络中系统性使用带孔卷积。
文章引用量:9000+
推荐指数:✦✦✦✦✦
[4] Krähenbühl P, Koltun V. Efficient inference in fully connected crfs with gaussian edge potentials[C]//Advances in neural information processing systems. 2011: 109-117.
[5] Chen L C, Papandreou G, Kokkinos I, et al. Semantic image segmentation with deep convolutional nets and fully connected crfs[J]. arXiv preprint arXiv:1412.7062, 2014.
[6] Zheng S, Jayasumana S, Romera-Paredes B, et al. Conditional random fields as recurrent neural networks[C]//Proceedings of the IEEE international conference on computer vision. 2015: 1529-1537.
[7] Yu F, Koltun V. Multi-scale context aggregation by dilated convolutions[J]. arXiv preprint arXiv:1511.07122, 2015.
4 ParseNet和PSPNet
多尺度和特征融合对于语义分割任务非常重要,ParseNet[8]使用了全局特征和局部特征融合的方案,PSPNet[9]则使用了多尺度的池化特征,都是早期比较经典的模型。
文章引用量:600+
推荐指数:✦✦✦✦✧
[8] Liu W, Rabinovich A, Berg A C. Parsenet: Looking wider to see better[J]. arXiv preprint arXiv:1506.04579, 2015.
[9] Zhao H, Shi J, Qi X, et al. Pyramid scene parsing network[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2881-2890.
5 如何获取文章与交流
找到有三AI开源项目即可获取。
https://github.com/longpeng2008/yousan.ai
以上就是初次学习图像分割需要读的文章,下一次,我们将推荐入门GAN需要读的文章。
有三AI夏季划
有三AI夏季划进行中,欢迎了解并加入,系统性成长为中级CV算法工程师。