作者&编辑 | 言有三

有三AI知识星球的“数据集”板块中已经提供了非常多的珍贵的数据集介绍和下载,从人脸相关的任务,到美学摄影,到一些大型数据集,今天介绍几个人像分割相关的数据集。

1 图像分割算法

关于图像分割的知识,大家可以关注我们相关的技术文章,从传统算法到深度学习算法,有综述,有各类模型的解读,如下:


​【技术综述】闲聊图像分割这件事儿​

​【完结】12篇文章带你逛遍主流分割网络​

​【技术综述】基于弱监督深度学习的图像分割方法综述​

2 肖像分割数据集

肖像分割是一类比较特殊的人像分割问题,通常是将自拍的半身人像提取出后应用风格化,背景替换,调整景深等算法。

有三AI知识星球-数据集

Automatic Portrait Matting

【知识星球】几个人像分割数据集简介和下载_深度学习

Automatic Portrait Matting数据集是一个图像分割数据集,包含2000张图像和对应的Matting标注结果,大小为600×800,都是自拍图像。

作者/编辑 言有三

数据集地址:http://www.cse.cuhk.edu.hk/~leojia/projects/automatting/,发布于2016年,无法下载可以移步有三AI知识星球。

数据集包含2000张图,训练集1700张,测试集300张,数据都是来源于Flickr的肖像图,图像原始分辨率大小为600×800,其中Matting用closed-form matting和KNN matting方法生成。

由于肖像分割数据集商业价值较高,因此公开的大规模数据集很少,这个数据集是其中发布较早,使用范围也较广的一个数据集,它有几个比较重要的特点:

(1) 图像分辨率统一,拍摄清晰,质量很高。

(2) 所有图像均为上半身的肖像图,人像区域在长度和宽度均至少占据图像的2/3。

(3) 人物的姿态变化很小,都为小角度的正面图,背景较为简单。

【知识星球】几个人像分割数据集简介和下载_图像分割_02

【知识星球】几个人像分割数据集简介和下载_图像分割_03

【知识星球】几个人像分割数据集简介和下载_数据集_04

[1] Shen X, Tao X, Gao H, et al. Deep Automatic Portrait Matting[M]// ComputerVision – ECCV 2016. Springer International Publishing, 2016:92-107.

3 人脸部位分割数据集

人脸parsing是专门针对人脸的各个子区域的分割问题,分割出各个部位后常用于人像美颜等应用。

有三AI知识星球-数据集

Helen Parsing dataset

【知识星球】几个人像分割数据集简介和下载_图像分割_05

Helen Parsing dataset是将关键点检测数据集Helen Dataset进行了标注后得到的人脸图像分割数据集,包含2000张训练图像和330张测试图像。

数据集地址:http://www.cs.wisc.edu/~lizhang/projects/face-parsing/,发布于2013年。

这是一个人脸分割数据集,包含面部区域10类的标注,分别是Face skin,Left eye,Right eye,Left brow,Right brow,Nose,Inner mouth,Upper lip,Lower lip,Background。

【知识星球】几个人像分割数据集简介和下载_图像分割_06

【知识星球】几个人像分割数据集简介和下载_深度学习_07

[1] Smith B M, Zhang L, Brandt J, et al. Exemplar-based face parsing[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2013: 3484-3491.

4 人体分割数据集

人体分割数据集包含所有类型的人像图,有各种姿态,各种人体比例,非常多样化,可以用于更加精细和复杂的抠图场景。

有三AI知识星球-数据集

LIP dataset

【知识星球】几个人像分割数据集简介和下载_图像分割_08

Look into Person (LIP)是一个人体分割和人体关键点数据集,包含50,462张图片,19个语义类别的标注,16个人体关键点标注。

数据集地址:http://www.sysu-hcp.net/lip/,发布于2018年。


Look into Person (LIP)包含50,462张图片,19个语义类别的标注,加上背景共20类。其中训练数据集30,462张,测试集和验证集都是10,000张。

数据集中的图像来自于Microsoft COCO中抠出来的人像,19个语义类别分别是hat, hair, sunglasses, upper-clothes, dress, coat, socks, pants, gloves, scarf, skirt, jumpsuits, face, right arm, left arm, right leg, left leg, right shoe, left shoe,几乎包含了所有人体有用的信息,以下是其中的标注样例:

【知识星球】几个人像分割数据集简介和下载_数据集_09

【知识星球】几个人像分割数据集简介和下载_图像分割_06

【知识星球】几个人像分割数据集简介和下载_深度学习_11

上图展示了其中的一些统计特性,可知道数据集多样性非常好。

[1] Gong K, Liang X, Zhang D, et al. Look into person: Self-supervised structure-sensitive learning and a new benchmark for human parsing[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 932-940.