语义分割的数据集语义分割数据集大小

转载

mob6454cc6553fc 2024-05-01 14:04:09

文章标签 语义分割的数据集深度学习机器学习计算机视觉数据集 文章分类 计算机视觉人工智能

语义分割数据集说明（一）------Cityscapes，PASCAL VOC2012

1. Cityscapes
2. PASCAL VOC 2012

为了方便了解和使用，整理下数据集的说明，主要是语义分割部分。

1. Cityscapes

该数据集的说明可参见官网https://www.cityscapes-dataset.com/，或者https://github.com/mcordts/cityscapesScripts ，以及其他博客。下载该数据解压后，：

1）下载该数据解压后，具体的数据位置结构如下图所示：

语义分割的数据集语义分割数据集大小_数据集

该数据集包含精标数据5000份,图片数据存放在“leftImg8bit”目录下，训练集和验证集的语义ground truth放在“gtFine”目录下，其中

图片尺寸： 1024*2048

训练集: 2975， 验证集: 500， 测试集: 1525

总共类别数目为：包括未标注的0类，总共35类, 其中的labels说明如下图，参见labels.py

2）详细的35类标签如下如所示：

语义分割的数据集语义分割数据集大小_数据集_02

注意到上图中“ignoreInEval”列含有16类在测试集上进行计算时需要忽略，所以总共有19类，关于语义分割任务。

2. PASCAL VOC 2012

PASCAL-VOC2012数据集说明可参见官网http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html。注意在下载了训练和测试数据后，如下所示：

语义分割的数据集语义分割数据集大小_计算机视觉_03

1）当解压三个tar文件之后，训练、验证、测试数据都放到了“VOCdevkit/VOC2012”目录下，如下图所示：

语义分割的数据集语义分割数据集大小_数据集_04

2）PASCAL VOC 2012总共有17125张图片数据，存放在解压后的“VOCdevkit/VOC2012/JPEGImages”目录下，用于不同的任务。注意到这些图片的尺寸大小不一，横向图片尺寸大约在375x500，纵向图片尺寸大约在500x375左右。但是基本偏差不超过100（可参考其他博客）。对于语义分割任务，这个数据含有20类（不包括背景类），具体类别如下：

Person: person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

但是“VOCdevkit/VOC2012/SegmentationClasses”下只有2913张语义分割labels图，即17125张图片中只有2913张图片用于语义分割任务。这2913张图片共同构成语义分割任务的训练集和验证集，具体如下：
训练集： 1464， 验证集： 1449，
而测试集有1456张图片。
这2913张语义分割任务对应的图片名字列表，存放在“VOCdevkit/VOC2012/ImageSets/Segmentation”下的“train.txt”, “val.txt”。

3）然后关于语义分割任务的训练集、验证集、测试集数据列表就在上图中的“ImageSets/Segmentation”下面。（注意这里的ImageSets下的每个目录相当于不同的任务，实则上不同的数据集列表，后面都加了后缀如“_train”, “_val”, "_test"用于区分训练、验证、测试数据）。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。