之前给大家介绍了基础的遥感数据知识和智能遥感任务,本期就来盘点一下在遥感模型训练中常用的数据集。
从应用领域出发,遥感影像样本数据集可分为8个类型:遥感场景识别、土地覆被/利用分类、专题要素提取、变化检测、目标检测、语义分割、定量遥感、其他。[1]
本期主要分享7个可用于遥感场景识别/分类的数据集:
No.1
UC Merced Land Use
● 发布方:University of California, Merced
● 下载地址:
http://weegee.vision.ucmerced.edu/datasets/landuse.html
● 论文地址:
https://dl.acm.org/doi/abs/10.1145/1869790.1869829
● 发布时间:2010
● 简介:
UC Merced 是加州大学默塞德分校 Newsam等于2010年提出的经典遥感场景识别数据集,用于对城市地区的土地利用场景进行分类。图像均提取自 USGS National Map。
该数据集的空间分辨率约为0.3m,图像尺度为256像素×256像素,包含21类场景,每类100张,共计2100张影像。
No.2
WHU-RS19
● 发布方:武汉大学
● 下载地址
https://captain-whu.github.io/BED4RS/#
● 论文地址:
https://ieeexplore.ieee.org/abstract/document/5545358
● 发布时间:2011
● 简介:
WHU-RS19 是从 Google Earth 导出的一组卫星图像,可提供高达0.5m的高分辨率卫星图像。可用于场景分类和检索。
包含19类高分辨率卫星图像有意义的场景,包括机场、海滩、桥梁、商业、沙漠、农田、足球场、森林、工业、草地、山、公园、停车处、池塘、港口、火车站、住宅、河流, 和高架桥。每个类大约有50个样本。值得注意的是,同一类别的图像样本是从不同分辨率的卫星图像中的不同区域采集的,因此可能具有不同的尺度、方向和光照。
图像尺度为600像素×600 像素,包含19类场景,每类50张,共计1005张影像。数据集样本预览见下图。
No.3
RSSCN7
● 发布方:武汉大学
● 下载地址:
https://pan.baidu.com/s/1slSn6Vz
● 论文地址:
https://www.researchgate.net/publication/283200405_Deep_Learning_Based_Feature_Selection_for_Remote_Sensing_Scene_Classification
● 发布时间:2015
● 简介:
RSSCN7 Dataset 包含2800幅遥感图像,这些图像来自于7个典型的场景类别 —— 草地、森林、农田、停车场、住宅区、工业区和河湖,其中每个类别包含400张图像,分别基于4个不同的尺度进行采样。
该数据集中每张图像的像素大小为400*400,场景图像的多样性导致其具有较大的挑战性,这些图像来源于不同季节和天气变化,并以不同的比例进行采样。
No.4
AID
● 发布方:武汉大学、华中科技大
● 下载地址:
https://captain-whu.github.io/BED4RS/#
● 论文地址:
https://captain-whu.github.io/AID/
● 发布时间:2017
● 简介:
AID是一个大型航空图像数据集,它从Google Earth图像中收集样本图像。尽管Google Earth图像是使用原始光学航空图像的RGB渲染进行后处理的,但事实证明,即使在像素级土地利用/覆盖图中,Google Earth图像与实际光学航空图像之间也没有显著差异。因此,Google Earth图像也可以用作评估场景分类算法的航空图像。
10000张含标签场景影像,包含30类场景,每类约200—420张,影像大小为600像素×600像素。
No.5
SIRI-WHU
● 发布方:武汉大学
● 下载地址:
谷歌影像数据集:
http://www.lmars.whu.edu.cn/prof_web/zhongyanfei/Num/Google.html
USGS标注影像:
http://www.lmars.whu.edu.cn/prof_web/zhongyanfei/Num/USGS.html
● 论文地址:
https://www.researchgate.net/publication/283301635_Dirichlet-derived_multiple_topic_scene_classification_model_fusing_heterogeneous_features_for_high_resolution_remote_sensing_imagery
● 发布时间:2015
● 简介:
SIRI-WHU数据集,包括 Google image、USGS image2个数据子集。分别包含12种、4种土地利用类型的遥感影像,分别提取自Google Earth、USGS。
谷歌影像数据集
包括12个类别,主要用于科研用途。以下各个类别中均包含200幅影像:每一幅影像大小为200*200,空间分辨率为2米。该数据集的获取来自于谷歌地球,主要覆盖了中国的城市地区。
农场 | 商业区 | 港口 |
工业区 | 草地 | 立交桥 |
池塘 | 停车场 | 闲置用地 |
居民区 | 河流 | 水体 |
USGS标注影像
The USGS image dataset of SIRI-WHU标注影像包括4个类别,主要用于科研用途。彩色航空正射影像USGS image dataset of SIRI-WHU主要包括以下四个场景类别:
农场 | 森林 |
停车场 | 居民区 |
大幅影像的大小为10000*9000,空间分辨率为2英尺。影像获取自USGS,覆盖了美国俄亥俄州蒙哥马利。
No.6
NWPU-RESISC45
● 发布方:西北工业大学
● 下载地址:
https://gcheng-nwpu.github.io/#Datasets
● 论文地址:
https://arxiv.org/ftp/arxiv/papers/1703/1703.00121.pdf
● 发布时间:2017
● 简介:
此数据集包含像素大小为256*256的图像共计31500张,涵盖45个场景类,每个类中有700张图像。
该数据集涵盖了全球100多个具有发展中、转型中和高度发达经济体的国家和地区,是目前属于较大规模的数据集,同时场景影像在平移、空间分辨率、视点、物体姿势、照明、背景和遮挡方面存在很大差异,具有很大的组内差异性和组间相似性。
No.7
TG1HRSSC
● 发布方:中国科学院空间应用工程与技术中心
● 下载地址:
http://www.msadc.cn/main/setsubDetail?id=1369487569196158978
● 论文地址:
https://www.ygxb.ac.cn/thesisDetails#10.11834/jrs.20209323&lang=zh
● 发布时间:2017
● 简介:
该数据集包括天宫一号高光谱成像仪获取的城镇、农田、林地、养殖塘、荒漠、湖泊、河流、港口、机场等9个典型地物场景的204个高光谱影像数据,其中5m分辨率全色谱段1个波段、10m分辨率可见近红外谱段54个有效波段以及20m分辨率短波红外谱段52个有效波段。
数据获取时段:7:00 —19:00;数据量490MB。
参考资料
[1]冯权泷,陈泊安,李国庆,姚晓闯,高秉博,张连翀. 遥感影像样本数据集研究综述[J]. 遥感学报,2022,26(04):589-605.