背景

复现Retinex算法时看别人代码发现一句:

im_blur[s, :, :, channel] = 这里的代码不重要
np.mean(im_blur, 0)

变量im_blur在这里是一个高维numpy数组,上面的代码对im_blur赋值后又对其某个轴求了平均值。虽然能明白作者的意图,但高位数组加上求平均就给我看得有点懵,特此记录。

np.mean

先来看Numpy官网对mean函数参数的定义:

numpy.mean(a, axis=None, dtype=None, out=None, keepdims=<no value>, *, where=<no value>)

只说本文感兴趣的前两个变量。第一个变量a就不说了;第二个变量axis表示所求平均值对应的轴。

假定存在一个高维np数组a,定义为:

a = np.array([[[[1, 1, 1], [1, 1, 1]],[[2, 2, 2], [2, 2, 2]], [[3, 3, 3], [3, 3, 3]]],
              [[[4, 4, 4], [4, 4, 4]],[[6, 6, 6], [6, 6, 6]], [[8, 8, 8], [8, 8, 8]]]])

显然a是一个形状为[2, 3, 2, 3]的四维数组,那么在np.mean函数的axis参数中,有四个轴可选:axis = 0, 1, 2, 3;如果a为五位数组,那么axis参数有五个轴可选axis = 0, 1, 2, 3, 4;更高维度以此类推。本文以四维上面的四维数组为例:

定义数组a:

python 计算nc文件的均值 numpy计算平均值_数组


可以看到数组形状为dim_range = (2, 3, 2, 3),形状对应的axis命名为axis = (0, 1, 2, 3)

  • dim_range = 2, axis = 0时,
  • python 计算nc文件的均值 numpy计算平均值_赋值_02

  • 可以看到求平均后的输出形状正好对应数组a去掉0轴之后的形状,也就是说,此时对数组a求的平均,是将a[0, :, :, :]a[1, :, :, :] 对应位置相加除以元素个数得到的输出,即:
  • python 计算nc文件的均值 numpy计算平均值_numpy_03

  • 将上图中每个红色矩形框中,两个对应的数组相加除2得到的结果。
  • dim_range = 3, axis = 1时,
  • python 计算nc文件的均值 numpy计算平均值_numpy_04

  • 可以看到求平均后的输出形状正好对应数组a去掉1轴之后的形状,也就是说,此时对数组a求的平均,是将a[:, 0, :, :]a[: , 1, :, :]a[: , 2, :, :] 对应位置相加除以元素个数得到的输出,即:

python 计算nc文件的均值 numpy计算平均值_python_05


([1, 1, 1] + [2, 2, 2] + [3, 3, 3]) / 3 = [2, 2, 2]

  • dim_range = 2, axis = 2时,

    可以看到求平均后的输出形状正好对应数组a去掉2轴之后的形状,也就是说,此时对数组a求的平均,是将a[:, :, 0, :]a[:, :, 1, :] 对应位置相加除以元素个数得到的输出