NetCDF4格式介绍

什么是netCDF数据?

NetCDF (network Common Data Form)是一种”自我描述”的数据结构,即元数据或数据描述包含在文件本身中,并且可以通过编程方式进行解析,这意味着可以使用代码访问这些数据,从而构建自动化和可重复的工作流。

NetCDF文件可以存储多维数据,通过包含地理空间图像、栅格、地形数据、气候数据和文本的数组来存储不同类型的数据。这些数组支持元数据,使netCDF格式具有高度灵活性。NetCDF是由UCAR开发的,UCAR负责维护支持使用该格式的标准和软件。

NetCDF4格式的气候数据

netCDF4数据标准被气候科学界广泛用于存储气候数据,主要包括以下信息:

时间序列数据(历史数据或未来预测数据的月份和年份)

空间范围

自我描述的解释文档

netCDF4格式支持数组格式存储的数据,阵列用于存储栅格空间数据(地形层、网格化温度数据等)和基于点的时间序列数据(例如10年以上单一位置的温度)。气候数据通常有3个维度x和y分别代表地球表面和时间上某个点或网格单元的经纬度位置,第三个维度通常存储温度、湿度、降水量或风向等数据值。

NetCDF4格式的自描述性

使用netCDF这样的数据类型的最大好处之一是它可以自我描述。这意味着处理数据所需的所有元数据通常都包含在netCDF文件中(.nc)。

python 气象读取nc文件 python处理气象nc数据_元数据

netCDF数据的处理工具

netCDF数据的常用工具为:hdfview

python中netcdf文件的开源工具有:

Xarray: 用于处理netcdf数据的最常用工具之一,Xarray可以自动打开netcdf文件,并访问空间格式的数据和元数据。

Rioxarray: 一个添加空间功能的Xarray强化包,可以将数据导出为geotiff格式。

Regionmask: Regionmask构建在Xarray之上,以支持通过空间操作对nc文件进行裁剪等操作。

参考链接

https://www.earthdatascience.org/courses/use-data-open-source-python/hierarchical-data-formats-hdf/intro-to-climate-data/