作者主页(文火冰糖的硅基工坊​):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_博客


目录

​第1章 MS COCO概述​

​1.1 概述​

​1.2 数据集分类​

​第2章 与PASCAL VOC数据集比较​

​2.1 COCO数据集的特点​

​2.2 COCO与VOC目标数量比较​

​2.3 更进一步的比较​

​2.4 每张图片上的类别数量或者实例数量的分布​

​第3章 MS COCO数据集的文件组织​

​第4章 MS COCO数据的标签文件的格式: JASON​


第1章 MS COCO概述

[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO_MS COCO

 1.1 概述

​MS COCO​​ (Microsoft COCO: Common Objects in Context) .

MSCOCO数据集是微软开发维护的大型图像数据集,其主要任务包括:目标检测(detection)、目标识别(recognition),目标分割(segementation)。

1.2 数据集分类

COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。

这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。

图像包括91类目标,328,000影像和2,500,000个label。

目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

MS COCO数据集包含很多的分支,


第2章 与PASCAL VOC数据集比较

2.1 COCO数据集的特点

与VOC数据集相比,COCO中的图片:(1)包含了自然图片以及生活中常见的目标图片,(2)背景比较复杂,(3)目标数量比较多,(4)目标尺寸更小,(5)因此COCO数据集上的任务更难。

对于检测任务来说,现在衡量一个模型好坏的标准更加倾向于使用COCO数据集上的检测结果。

2.2 COCO与VOC目标数量比较

[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO_目标检测_02

从比较结果来看:

(1) coco的类别,远远多由于VOC

(2)相同的类别,coco图片的数量也大于VOC图片的数量(instance)

2.3 更进一步的比较

[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO_深度学习_03


  • PASCAL VOC:20分类。
  • MS COCO     :91分类,接近100分类。
  • ImageNet       :>10000分类。

2.4 每张图片上的类别数量或者实例数量的分布

[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO_数据集_04


  • PASCAL和ImageNet中,每张图片上的类别或者实例数量普遍都很少。
    以PASCAL为例:有多于70%的图片上都只有一个类别,而多于50%的图片上只有一个实例或者目标。PASCAL数据集平均每张图片包含1.4个类别和2.3个实例目标,ImageNet也仅有1.7和3.0个。
  • COCO数据集平均每张图片包含 3.5个类别和 7.7 个实例目标,仅有不到20%的图片只包含一个类别,仅有10%的图片包含一个实例目标。
  • COCO数据集不仅数据量大,种类和实例数量也多。从这角度来说 SUN 数据集这两个指标更高一点,但是这个数据集在目标检测里面并不常用。

第3章 MS COCO数据集的文件组织

[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO_深度学习_05

第4章 MS COCO数据的标签文件的格式: JASON

COCO通过大量使用Amazon Mechanical Turk来收集数据。

COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。每种类型又包含了训练和验证,所以共6个JSON文件。

这3种类型共享下面所列的基本类型,包括info、image、license,而annotation类型则呈现出了多态:

{
"info": info,
"licenses": [license],
"images": [image],
"annotations": [annotation],
}

info{
"year": int,
"version": str,
"description": str,
"contributor": str,
"url": str,
"date_created": datetime,
}
license{
"id": int,
"name": str,
"url": str,
}
image{
"id": int,
"width": int,
"height": int,
"file_name": str,
"license": int,
"flickr_url": str,
"coco_url": str,
"date_captured": datetime,
}


"info":{
"description":"This is stable 1.0 version of the 2014 MS COCO dataset.",
"url":"http:\/\/mscoco.org",
"version":"1.0","year":2014,
"contributor":"Microsoft COCO group",
"date_created":"2015-01-27 09:11:52.357475"
},



{
"license":3,
"file_name":"COCO_val2014_000000391895.jpg",
"coco_url":"http:\/\/mscoco.org\/images\/391895",
"height":360,"width":640,"date_captured":"2013-11-14 11:18:45",
"flickr_url":"http:\/\/farm9.staticflickr.com\/8186\/8119368305_4e622c8349_z.jpg",
"id":391895
},


{
"url":"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/",
"id":1,
"name":"Attribution-NonCommercial-ShareAlike License"
},

备注:

COCO JASON文件不同于Labelme的Jason文件,他们之间需要进行格式的转换。


作者主页(文火冰糖的硅基工坊​):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_博客