coco数据集中17个关键点索引 coco 数据集

转载

mob6454cc79ab13 2024-04-19 11:02:39

文章标签 coco数据集中17个关键点索引 coco 数据集 coco官方数据集jsion coco数据集 coco数据集格式 文章分类 数据仓库大数据

coco数据集中17个关键点索引 coco 数据集_coco数据集中17个关键点索引

COCO数据集现在有3种标注类型：object instances（目标实例）, object keypoints（目标上的关键点）, 和image captions（看图说话），使用JSON文件存储。

网上已有很多优秀的文章来介绍每种标注的json文件的内容和格式，本文主要是对以后将要用到的object instances（目标实例）的标注文件进行总结，便于后续的将其他数据集转换成COCO数据集做准备。

一、总体介绍

COCO数据集中目标实例的json文件整体是以字典的形式来存储内容的。主要包括5个key（info、licenses、images、annotations、categories）。

{ 
    "info" : info,
    "licenses" : [license],
    "images" : [image],
    "annotations" : [annataton],
    "categories" : [category]
}

通过上面的json整体结构可以看出，info这个key对应的值的类型是一个字典；licenses这个key对应的值的类型是一个列表，列表当中存储的数据类型依旧是字典；images这个key对应的值的类型是一个列表，列表当中存储的数据类型依旧是字典；annatations这个key对应的值的类型是一个列表，列表当中存储的数据类型依旧是字典；categories这个key对应的值的类型是一个列表，列表当中存储的数据类型依旧是字典；

所以可以通过len(List)的方式得到images、annotations、categories这三个列表的长度，且分别对应以下内容。

（1）images字段列表元素的长度等同于划入训练集（或者测试集）的图片的数量；
（2）annotations字段列表元素的数量等同于训练集（或者测试集）中bounding box的数量；
（3）categories字段列表元素的数量等同于类别的数量

二、每个key对应的内容

（1）info

info{
"year" : int,                # 年份
"version" : str,             # 版本
"description" : str,         # 详细描述信息
"contributor" : str,         # 作者
"url" : str,                 # 协议链接
"date_created" : datetime,   # 生成日期
}

（2）images

"images": [                                            
{"id": 0,                                                # int 图像id，可从0开始
 "file_name": "0.jpg",                                   # str 文件名
 "width": 512,                                           # int 图像的宽
 "height": 512,                                          # int 图像的高
 "date_captured": "2020-04-14 01:45:07.508146",          # datatime 获取日期
 "license": 1,                                           # int 遵循哪个协议
 "coco_url": "",                                         # str coco图片链接url
 "flickr_url": ""                                        # str flick图片链接url
}]

（3）licenses

"licenses": [
{
 "id": 1,                                            # int 协议id号      在images中遵循的license即1
 "name": null,                                       # str 协议名        
 "url": null                                         # str 协议链接      
}]

（4）annotations

"annotations": [ 
{
 "id": 0,                                   # int 图片中每个被标记物体的id编号
 "image_id": 0,                             # int 该物体所在图片的编号
 "category_id": 2,                          # int 被标记物体的类别id编号
 "iscrowd": 0,                              # 0 or 1 目标是否被遮盖，默认为0
 "area": 4095.9999999999986,                # float 被检测物体的面积（64 * 64 = 4096)
 "bbox": [200.0, 416.0, 64.0, 64.0],        # [x, y, width, height] 目标检测框的坐标信息
 "segmentation": [[200.0, 416.0, 264.0, 416.0, 264.0, 480.0, 200.0, 480.0]]  
}]

"bbox"里[x, y, width, height]x, y代表的是物体的左上角的x, y的坐标值。

"segmentation"里[x1, y1, x2, y2, x3, y3, x4, y4]是以左上角坐标为起始，顺时针依次选取的另外三个坐标点。及[左上x, 左上y, 右上x，右上y，右下x，右下y，左下x，左下y]。

（5）categories

"categories":[
{
 "id": 1,                                 # int 类别id编号
 "name": "rectangle",                     # str 类别名字
 "supercategory": "None"                  # str 类别所属的大类，如卡车和轿车都属于机动车这个class
}, 
{
 "id": 2,
 "name": "circle", 
 "supercategory": "None"
 }
]