首先,明确一点,tf.argmax可以认为就是np.argmax。tensorflow使用numpy实现的这个API。 

   

  简单的说,tf.argmax就是返回最大的那个数值所在的下标。 

   

  这个很好理解,只是tf.argmax()的参数让人有些迷惑,比如,tf.argmax(array, 1)和tf.argmax(array, 0)有啥区别呢? 

   

  这里面就涉及到一个概念:axis。上面例子中的1和0就是axis。我先笼统的解释这个问题,设置axis的主要原因是方便我们进行多个维度的计算。

  在实例面前,再多的语言都是苍白的呀,上例子!

  比如:



test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3], [8, 7, 2]])
np.argmax(test, 0)   #输出:array([3, 3, 1]
np.argmax(test, 1)   #输出:array([2, 2, 0, 0]


  啥意思呢?

  • axis = 0: 
      你就这么想,0是最大的范围,所有的数组都要进行比较,只是比较的是这些数组相同位置上的数(我的理解是0 列比较输出):


test[0] = array([1, 2, 3])
test[1] = array([2, 3, 4])
test[2] = array([5, 4, 3])
test[3] = array([8, 7, 2])
# output : [3, 3, 1]


 

axis = 1: (行比较输出

  等于1的时候,比较范围缩小了,只会比较每个数组内的数的大小,结果也会根据有几个数组,产生几个结果。



test[0] = array([1, 2, 3])  #2
test[1] = array([2, 3, 4]) #2
test[2] = array([5, 4, 3]) #0
test[3] = array([8, 7, 2]) #0


 

  这是里面都是数组长度一致的情况,如果不一致,axis最大值为最小的数组长度-1,超过则报错。 

  当不一致的时候,axis=0的比较也就变成了每个数组的和的比较。

正确的解释应该是:tf.argmax()以及axis解析_嵌入式

 第一个代码就是,返回以0轴为方向的,每一列最大值的索引值,1表示1轴,2表示2轴




作者:柒月