行人检测(人体检测)1:人体检测数据集(含下载链接)

目录

行人检测(人体检测)1:人体检测数据集(含下载链接)

1. 前言

2. VOC数据集

3. COCO数据集

4. MPII数据集

5.人体检测(包含人体+人脸框)数据集下载

6.人体检测(行人检测)效果(Python版本)

7.人体检测(行人检测)效果(Android版本)


1. 前言

这是项目《行人检测(人体检测)》系列之《人体检测数据集》;我们将介绍几个常见的人体检测数据集:VOC,COCO和MPII数据集,总数据量约10W左右,可用于人体(行人)检测模型算法开发。这三个数据集都标注了人体检测框,但没有人脸框,考虑到很多项目业务需求,需要同时检测人脸和人体框;故已经将这三个数据都标注了person和face两个标签,以便深度学习目标检测模型训练。

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测




行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测_02

 如果需要进行人像分割,实现一键抠图效果,请参考文章:《一键抠图Portrait Matting人像抠图 (C++和Android源码)》

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人数据集_03

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人检测_04

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体数据集_05


2. VOC数据集

VOC数据集,这应该是深度学习目标检测最常见的数据集,一共有20个类别,分为VOC2007和VOC2012两个数据集,总共约2.7W的数据量。如果你只需要训练人体检测,需要提取VOC数据集中person标签的数据。

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人检测_06

"aeroplane",
 "bicycle", 
 "bird", 
 "boat", 
 "bottle", 
 "bus", 
 "car", 
 "cat",
 "chair", 
 "cow", 
 "diningtable", 
 "dog", 
 "horse", 
 "motorbike", 
"person", 
 "pottedplant", 
 "sheep", 
 "sofa", 
 "train", 
 "tvmonitor"

3. COCO数据集

COCO数据集是一个可用于图像检测(image detection),语义分割(semantic segmentation)和图像标题生成(image captioning)的大规模数据集。它有超过330K张图像(其中220K张是有标注的图像),包含150万个目标,80个目标类别(object categories:行人、汽车、大象等),91种材料类别(stuff categoris:草、墙、天空等),每张图像包含五句图像的语句描述,且有250,000个带关键点标注的行人。

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测_07

  

'background', 'person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train','truck', 'boat', 'traffic light', 'fire hydrant', 'stop sign','parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep',
'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella',
'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard', 'sports ball','kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard', 'tennis racket','bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana',
'apple', 'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed', 'dining table', 'toilet','tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone', 'microwave','oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush'

如果你只需要训练人体检测,需要提取VOC数据集中person标签的数据。


4. MPII数据集

MPII 人体姿势数据集是用于评估铰接式人体姿势估计的最先进基准。该数据集包括大约 25,000 张图像,其中包含超过40,000 个人的身体关节注释。这些图像是使用日常人类活动的既定分类法系统地收集的。总体而言,该数据集涵盖了 410 种人类活动,并且每张图像都带有一个活动标签。每张图片都是从 YouTube 视频中提取的,并提供了前后未注释的帧。

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人检测_08

  • 下载地址:http://human-pose.mpi-inf.mpg.de/#download

MPII数据集原本是2D-Pose人体关键点检测(人体姿势数据集),稍微处理即可获得person的人体检测数据集。


5.人体检测(包含人体+人脸框)数据集下载

原始官方下载VOC数据集,COCO数据集和MPII数据集,数据格式并不统一,也有很多非人体的数据,需求剔除。这里已经将这三个数据集整合为统一的格式人体检测数据集,数据统一转换为VOC数据格式,人体标注框名称统一为“person”;这三个数据集都标注了人体检测框,但没有人脸框,考虑到很多项目业务需求,需要同时检测人脸和人体框;故已经将这三个数据都标注了person和face两个标签,以便深度学习目标检测模型训练。

人体检测数据集包含VOC人体数据集+COCO人体数据集+MPII人体数据集

数据集下载地址行人检测(人体检测)1:人体检测数据集(含下载链接)

(1)VOC人体数据集 

  1. VOC2007: 共9963张图片
  2. VOC2012:共17125张图片
  3. 已经标注了人脸框(face)和人体框(person)
  4. 可直接用于深度学习人体检测模型训练

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测_09

(2)COCO人体数据集

  1. 总共66697张含有人体的图片
  2. 已经将COCO数据集转换为VOC数据格式,可直接用于深度学习人体检测模型训练
  3. 已经标注了人脸框(face)和人体框(person)
  4. 如果你需要原始COCO的数据集,请到官网https://cocodataset.org/ 下载

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人数据集_10

(3)MPII人体数据集

  1. 总共21430张含有人体的图片
  2. 已经将MPII数据集转换为VOC数据格式,可直接用于深度学习人体检测模型训练
  3. 已经标注了人脸框(face)和人体框(person)
  4. 如果你需要原始COCO的数据集,请到官网 http://human-pose.mpi-inf.mpg.de/#download 下载

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测_11



6.人体检测(行人检测)效果(Python版本)


行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_数据集_12

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_人体检测_02


7.人体检测(行人检测)效果(Android版本)


行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人检测_14

行人检测(人体检测)1:人体检测数据集(含下载链接)3. COCO数据集_行人数据集_15