【知识星球】几个人像分割数据集简介和下载

原创

言有三 2022-10-12 14:40:59 ©著作权

文章标签 数据集图像分割深度学习 文章分类 运维

©著作权归作者所有：来自51CTO博客作者言有三的原创作品，请联系作者获取转载授权，否则将追究法律责任

作者&编辑 | 言有三

有三AI知识星球的“数据集”板块中已经提供了非常多的珍贵的数据集介绍和下载，从人脸相关的任务，到美学摄影，到一些大型数据集，今天介绍几个人像分割相关的数据集。

1 图像分割算法

关于图像分割的知识，大家可以关注我们相关的技术文章，从传统算法到深度学习算法，有综述，有各类模型的解读，如下：

【技术综述】闲聊图像分割这件事儿

【完结】12篇文章带你逛遍主流分割网络

【技术综述】基于弱监督深度学习的图像分割方法综述

2 肖像分割数据集

肖像分割是一类比较特殊的人像分割问题，通常是将自拍的半身人像提取出后应用风格化，背景替换，调整景深等算法。

有三AI知识星球-数据集

Automatic Portrait Matting

【知识星球】几个人像分割数据集简介和下载_深度学习

Automatic Portrait Matting数据集是一个图像分割数据集，包含2000张图像和对应的Matting标注结果，大小为600×800，都是自拍图像。

作者/编辑言有三

数据集地址：http://www.cse.cuhk.edu.hk/~leojia/projects/automatting/，发布于2016年，无法下载可以移步有三AI知识星球。

数据集包含2000张图，训练集1700张，测试集300张，数据都是来源于Flickr的肖像图，图像原始分辨率大小为600×800，其中Matting用closed-form matting和KNN matting方法生成。

由于肖像分割数据集商业价值较高，因此公开的大规模数据集很少，这个数据集是其中发布较早，使用范围也较广的一个数据集，它有几个比较重要的特点：

(1) 图像分辨率统一，拍摄清晰，质量很高。

(2) 所有图像均为上半身的肖像图，人像区域在长度和宽度均至少占据图像的2/3。

(3) 人物的姿态变化很小，都为小角度的正面图，背景较为简单。

【知识星球】几个人像分割数据集简介和下载_图像分割_02

【知识星球】几个人像分割数据集简介和下载_图像分割_03

【知识星球】几个人像分割数据集简介和下载_数据集_04

[1] Shen X, Tao X, Gao H, et al. Deep Automatic Portrait Matting[M]// ComputerVision – ECCV 2016. Springer International Publishing, 2016:92-107.

3 人脸部位分割数据集

人脸parsing是专门针对人脸的各个子区域的分割问题，分割出各个部位后常用于人像美颜等应用。

有三AI知识星球-数据集

Helen Parsing dataset

【知识星球】几个人像分割数据集简介和下载_图像分割_05

Helen Parsing dataset是将关键点检测数据集Helen Dataset进行了标注后得到的人脸图像分割数据集，包含2000张训练图像和330张测试图像。

数据集地址：http://www.cs.wisc.edu/~lizhang/projects/face-parsing/，发布于2013年。

这是一个人脸分割数据集，包含面部区域10类的标注，分别是Face skin，Left eye，Right eye，Left brow，Right brow，Nose，Inner mouth，Upper lip，Lower lip，Background。

【知识星球】几个人像分割数据集简介和下载_图像分割_06

【知识星球】几个人像分割数据集简介和下载_深度学习_07

[1] Smith B M, Zhang L, Brandt J, et al. Exemplar-based face parsing[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2013: 3484-3491.

4 人体分割数据集

人体分割数据集包含所有类型的人像图，有各种姿态，各种人体比例，非常多样化，可以用于更加精细和复杂的抠图场景。

有三AI知识星球-数据集

LIP dataset

【知识星球】几个人像分割数据集简介和下载_图像分割_08

Look into Person (LIP)是一个人体分割和人体关键点数据集，包含50,462张图片，19个语义类别的标注，16个人体关键点标注。

数据集地址：http://www.sysu-hcp.net/lip/，发布于2018年。

Look into Person (LIP)包含50,462张图片，19个语义类别的标注，加上背景共20类。其中训练数据集30,462张，测试集和验证集都是10,000张。

数据集中的图像来自于Microsoft COCO中抠出来的人像，19个语义类别分别是hat, hair, sunglasses, upper-clothes, dress, coat, socks, pants, gloves, scarf, skirt, jumpsuits, face, right arm, left arm, right leg, left leg, right shoe, left shoe，几乎包含了所有人体有用的信息，以下是其中的标注样例：

【知识星球】几个人像分割数据集简介和下载_数据集_09

【知识星球】几个人像分割数据集简介和下载_图像分割_06

【知识星球】几个人像分割数据集简介和下载_深度学习_11

上图展示了其中的一些统计特性，可知道数据集多样性非常好。

[1] Gong K, Liang X, Zhang D, et al. Look into person: Self-supervised structure-sensitive learning and a new benchmark for human parsing[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 932-940.