文章目录
- 1.介绍
- 2.下载
- 2.1 官网
- 2.2 百度网盘
- 2.3 下载到linux服务器
1.介绍
MS COCO的全称是Microsoft Common Objects in Context,起源于微软2014年的Microsoft COCO数据集
COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features
主要用于目标检测,图像分割,姿态估计等,共有80个类
2.下载
下载的方法很多,从我自己下载的经历来看,主要有这么几种方法
2.1 官网
第一种方法肯定是官网,来到下载页面:https://cocodataset.org/#download
Images就是数据集,Annotations表示标注信息使用 JSON 格式存储( annotations ), COCO API用于访问和操作所有“标注”进行预处理
不同年份的数据集用在不同的任务上,常用的是2017 train/val/test images
2.2 百度网盘
众所周知,官网不是慢就是访问不了,(有时是点了没反应,有时是无法安全下载)所以得采取别的方法。
从我自身角度,我是官网下载点了没反应,所以我就只能去找下载链接,直接将需要下载数据集的链接输入到浏览器,就可以自动下载了。
我把几个常见的下载链接列了出来(以2017为例)如果需要下载其他的可以仿照
数据集 | 下载链接 |
2017 Train images [118K/18GB] | http://images.cocodataset.org/zips/train2017.zip |
2017 Val images [5K/1GB] | http://images.cocodataset.org/zips/val2017.zip |
2017 Test images [41K/6GB] | http://images.cocodataset.org/zips/test2017.zip |
2017 Train/Val annotations [241MB] | http://images.cocodataset.org/annotations/annotations_trainval2017.zip |
如果本地下载很慢(我试的时候挺快),可以用百度网盘的离线下载,打开百度网盘,点击离线下载,将上述链接输入,就可以保存到网盘了(也需要一点时间)
2.3 下载到linux服务器
如果是需要在服务器上进行跑实验,可以直接通过wget+下载链接,
例如:
wget http://images.cocodataset.org/zips/train2017.zip
wget http://images.cocodataset.org/zips/val2017.zip
wget http://images.cocodataset.org/zips/test2017.zip
实测速度emmm
(其实这就属于linux的命令了,只要是把链接输入到浏览器能够直接下载的,那这个命令就可以用,其他数据集下载也可以参考这样)
也可以用aria2工具,一个命令行下载器(详细的介绍,可以参考:Aria2 安装和使用全教程)
在这里就用他的基本用法:
sudo apt-get install aria2 # sudo安装
# aria2c -c <url> #<url>即为官网下载地址
aria2c -c http://images.cocodataset.org/zips/val2017.zip
实测速度会快一点……