NetCDF4格式介绍
什么是netCDF数据?
NetCDF (network Common Data Form)是一种”自我描述”的数据结构,即元数据或数据描述包含在文件本身中,并且可以通过编程方式进行解析,这意味着可以使用代码访问这些数据,从而构建自动化和可重复的工作流。
NetCDF文件可以存储多维数据,通过包含地理空间图像、栅格、地形数据、气候数据和文本的数组来存储不同类型的数据。这些数组支持元数据,使netCDF格式具有高度灵活性。NetCDF是由UCAR开发的,UCAR负责维护支持使用该格式的标准和软件。
NetCDF4格式的气候数据
netCDF4数据标准被气候科学界广泛用于存储气候数据,主要包括以下信息:
时间序列数据(历史数据或未来预测数据的月份和年份)
空间范围
自我描述的解释文档
netCDF4格式支持数组格式存储的数据,阵列用于存储栅格空间数据(地形层、网格化温度数据等)和基于点的时间序列数据(例如10年以上单一位置的温度)。气候数据通常有3个维度x和y分别代表地球表面和时间上某个点或网格单元的经纬度位置,第三个维度通常存储温度、湿度、降水量或风向等数据值。
NetCDF4格式的自描述性
使用netCDF这样的数据类型的最大好处之一是它可以自我描述。这意味着处理数据所需的所有元数据通常都包含在netCDF文件中(.nc)。
netCDF数据的处理工具
netCDF数据的常用工具为:hdfview
python中netcdf文件的开源工具有:
Xarray: 用于处理netcdf数据的最常用工具之一,Xarray可以自动打开netcdf文件,并访问空间格式的数据和元数据。
Rioxarray: 一个添加空间功能的Xarray强化包,可以将数据导出为geotiff格式。
Regionmask: Regionmask构建在Xarray之上,以支持通过空间操作对nc文件进行裁剪等操作。
参考链接