日常学习中总是遇到数据需要处理等问题,这时候我们就可以借助numpy这个工具来做一些有意思的事。
1.生成随机数的几种方式
x=np.random.random(12) ###生成12个随机数,也可以写成np.random.rand(12)、
np.random.random_integers、np.random.uniform、np.random.randint(np.random.randint(1,20,(3,4),dtype='int32'))、等形式
x=np.random.rand(3,4) ###生成3行4列12个随机数
x=np.random.normal(0,1,shape=(3,4)) ###生成以0为均值,1为方差的3行4列12个随机数
x=np.arange(12) ####生成0到11的矩阵
2、运算
(1)常规运算
对于加减就不多说,乘除多说两句,就是乘法需要注意矩阵的点乘(数学正常乘法和np.matmul(a,b.T)效果一样)和*乘(俗称数乘)。例子如下:
除法的话记住 a/b表示带余数除法 a//b表示整除
(2)广播机制
广播”指的是在不同维度的数组之间进行算术运算的一种执行机制,其通过将数据矢量化进行高效的运算,而不是按照传统的对标量数据进行循环运算达到目的。
“广播”的一个工作原则是:两个数组的维度应该相同(即要对一个二维数组进行广播,那么用来广播的数组也应该是二维的),并且只能有一个维度的长度允许不一样,且那个不一样的维度在用来广播的数组里面的长度应该为1(比如,对于一个(3,4)的二维数组,那么用来广播的数组必须是(3,1)或(1,4);比如对于一个三维的数组(3,4,5),用来广播的数组必须是(1,4,5)或(3,1,5)或(3,4,1)),这样子,我们才说两个数组是广播兼容的。广播会在沿着长度为1的那个维度进行扩散进行。(这里就知道,为什么我们需要一个长度为1的维度,其实就是广播进行扩散的维度)。例如:
补充注意:
numpy中a.shape为(m,)的数组在矩阵运算的过程中看作行向量处理,及a为1行m列。
3、切片
对于一维数组来说,python原生的list和numpy的array的切片操作都是相同的,记住一个规则arr_name[start: end: step]
就可以了。同时需要注意下面几个特殊点:
-
[:]
表示复制源列表 - 负的index表示,从后往前。-1表示最后一个元素。
- 相对于一维数组而言,二维(多维)数组用的会更多。一般语法是
arr_name[行操作, 列操作]
示例:
4、拼接
Python中numpy数组的合并有很多方法,如np.append() 、np.concatenate() 、np.stack() 、np.hstack()(水平拼接) 、np.vstack()(垂直拼接) 、np.dstack()(按位拼接) 其中最泛用的是第一个和第二个。第一个可读性好,比较灵活,但是占内存大。第二个则没有内存占用大的问题。
说了numpy的诸多好处,也来说下它的不足吧--不能自动求导。这时我们可以考虑ndarray,而ndarray 和 numpy 的多维数组非常类似。然而, NDArray 提供 GPU 计算和⾃动求梯度等更多功能,这些使得 NDArray 更加适合深度学习。具体学习可以参考mxnet.ndarray官网教程。