语义分割数据集说明(一)------Cityscapes,PASCAL VOC2012
- 1. Cityscapes
- 2. PASCAL VOC 2012
为了方便了解和使用,整理下数据集的说明,主要是语义分割部分。
1. Cityscapes
该数据集的说明可参见官网https://www.cityscapes-dataset.com/,或者https://github.com/mcordts/cityscapesScripts ,以及其他博客。下载该数据解压后,:
1)下载该数据解压后,具体的数据位置结构如下图所示:
该数据集包含精标数据5000份,图片数据存放在“leftImg8bit”目录下,训练集和验证集的语义ground truth放在“gtFine”目录下,其中
图片尺寸: 1024*2048
训练集: 2975, 验证集: 500, 测试集: 1525
总共类别数目为:包括未标注的0类,总共35类, 其中的labels说明如下图,参见labels.py
2)详细的35类标签如下如所示:
注意到上图中“ignoreInEval”列含有16类在测试集上进行计算时需要忽略,所以总共有19类,关于语义分割任务。
2. PASCAL VOC 2012
PASCAL-VOC2012数据集说明可参见官网http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html。注意在下载了训练和测试数据后,如下所示:
1)当解压三个tar文件之后,训练、验证、测试数据都放到了“VOCdevkit/VOC2012”目录下,如下图所示:
2)PASCAL VOC 2012总共有17125张图片数据,存放在解压后的“VOCdevkit/VOC2012/JPEGImages”目录下,用于不同的任务。注意到这些图片的尺寸大小不一,横向图片尺寸大约在375x500,纵向图片尺寸大约在500x375左右。但是基本偏差不超过100(可参考其他博客)。对于语义分割任务,这个数据含有20类(不包括背景类),具体类别如下:
- Person: person
- Animal: bird, cat, cow, dog, horse, sheep
- Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
- Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
但是“VOCdevkit/VOC2012/SegmentationClasses”下只有2913张语义分割labels图,即17125张图片中只有2913张图片用于语义分割任务。这2913张图片共同构成语义分割任务的训练集和验证集,具体如下:
训练集: 1464, 验证集: 1449,
而测试集有1456张图片。
这2913张语义分割任务对应的图片名字列表,存放在“VOCdevkit/VOC2012/ImageSets/Segmentation”下的“train.txt”, “val.txt”。
3)然后关于语义分割任务的训练集、验证集、测试集数据列表就在上图中的“ImageSets/Segmentation”下面。(注意这里的ImageSets下的每个目录相当于不同的任务,实则上不同的数据集列表,后面都加了后缀如“_train”, “_val”, "_test"用于区分训练、验证、测试数据)。