作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_博客
目录
1.1 概述
第4章 MS COCO数据的标签文件的格式: JASON
第1章 MS COCO概述
1.1 概述
MS COCO (Microsoft COCO: Common Objects in Context) .
MSCOCO数据集是微软开发维护的大型图像数据集,其主要任务包括:目标检测(detection)、目标识别(recognition),目标分割(segementation)。
1.2 数据集分类
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。
这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。
图像包括91类目标,328,000影像和2,500,000个label。
目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
MS COCO数据集包含很多的分支,
第2章 与PASCAL VOC数据集比较
2.1 COCO数据集的特点
与VOC数据集相比,COCO中的图片:(1)包含了自然图片以及生活中常见的目标图片,(2)背景比较复杂,(3)目标数量比较多,(4)目标尺寸更小,(5)因此COCO数据集上的任务更难。
对于检测任务来说,现在衡量一个模型好坏的标准更加倾向于使用COCO数据集上的检测结果。
2.2 COCO与VOC目标数量比较
从比较结果来看:
(1) coco的类别,远远多由于VOC
(2)相同的类别,coco图片的数量也大于VOC图片的数量(instance)
2.3 更进一步的比较
- PASCAL VOC:20分类。
- MS COCO :91分类,接近100分类。
- ImageNet :>10000分类。
2.4 每张图片上的类别数量或者实例数量的分布
- PASCAL和ImageNet中,每张图片上的类别或者实例数量普遍都很少。
以PASCAL为例:有多于70%的图片上都只有一个类别,而多于50%的图片上只有一个实例或者目标。PASCAL数据集平均每张图片包含1.4个类别和2.3个实例目标,ImageNet也仅有1.7和3.0个。 - COCO数据集平均每张图片包含 3.5个类别和 7.7 个实例目标,仅有不到20%的图片只包含一个类别,仅有10%的图片包含一个实例目标。
- COCO数据集不仅数据量大,种类和实例数量也多。从这角度来说 SUN 数据集这两个指标更高一点,但是这个数据集在目标检测里面并不常用。
第3章 MS COCO数据集的文件组织
第4章 MS COCO数据的标签文件的格式: JASON
COCO通过大量使用Amazon Mechanical Turk来收集数据。
COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。每种类型又包含了训练和验证,所以共6个JSON文件。
这3种类型共享下面所列的基本类型,包括info、image、license,而annotation类型则呈现出了多态:
{
"info": info,
"licenses": [license],
"images": [image],
"annotations": [annotation],
}
info{
"year": int,
"version": str,
"description": str,
"contributor": str,
"url": str,
"date_created": datetime,
}
license{
"id": int,
"name": str,
"url": str,
}
image{
"id": int,
"width": int,
"height": int,
"file_name": str,
"license": int,
"flickr_url": str,
"coco_url": str,
"date_captured": datetime,
}
"info":{
"description":"This is stable 1.0 version of the 2014 MS COCO dataset.",
"url":"http:\/\/mscoco.org",
"version":"1.0","year":2014,
"contributor":"Microsoft COCO group",
"date_created":"2015-01-27 09:11:52.357475"
},
{
"license":3,
"file_name":"COCO_val2014_000000391895.jpg",
"coco_url":"http:\/\/mscoco.org\/images\/391895",
"height":360,"width":640,"date_captured":"2013-11-14 11:18:45",
"flickr_url":"http:\/\/farm9.staticflickr.com\/8186\/8119368305_4e622c8349_z.jpg",
"id":391895
},
{
"url":"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/",
"id":1,
"name":"Attribution-NonCommercial-ShareAlike License"
},
备注:
COCO JASON文件不同于Labelme的Jason文件,他们之间需要进行格式的转换。
作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_博客