数组对象
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,从0 开始进行集合中元素的索引;ndarray 对象是用于存放同类型元素的多维数组,其中的每个元素在内存中都有相同存储大小的区域。
ndarray 内部由以下内容组成:
- 一个指向数据(内存或内存映射文件中的一块数据)的指针。
- 数据类型或(dtype),描述在数组中的固定大小值的格子。
- 一个表示数组形状(shape)的元组,表示各维度大小的元组。
- 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。
ndarray 的内部结构:
跨度可以是负数,这样会使数组在内存中后向移动,切片中 obj[::-1] 或 obj[:,::-1] 就是如此。
创建一个 ndarray 只需调用 NumPy 的 array 函数即可:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
参数说明:
名称 | 描述 |
object | 数组或嵌套的数列 |
dtype | 数组元素的数据类型,可选 |
copy | 对象是否需要复制,可选 |
order | 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认) |
subok | 默认返回一个与基类类型一致的数组 |
ndmin | 指定生成数组的最小维度 |
基本创建操作
In [1]: import numpy as np #导入模块
#np.array()用于创建一维或多维数组
In [2]: x = np.array([1,4,2,5,3])
In [3]: x
Out[3]: array([1, 4, 2, 5, 3])
#Numpy要求数组必须包含同一类型的数据,如果类型不一致,将会向上转换(整型会转换成浮点型)
In [5]: np.array([3.14,4,2,3])
Out[5]: array([3.14, 4. , 2. , 3. ])
#dtype用于指定数据类型
In [6]: np.array([1,2,3,4],dtype='float64')
Out[6]: array([1., 2., 3., 4.])
#嵌套列表构成多维数组
In [7]: np.array([range(i,i+3) for i in [2,4,6]])
Out[7]:
array([[2, 3, 4],
[4, 5, 6],
[6, 7, 8]])
#numpy.asarray(a, dtype = None, order = None) 从已有的数组创建数组
In [16]: x = [1,2,3]
In [17]: a = np.asarray(x[:2])
In [18]: a
Out[18]: array([1, 2])
#创建一个长度为10的整数型数组,数组的值都是0
#numpy.zeros(shape, dtype = float, order = 'C或F')
In [2]: np.zeros(10,dtype=int)
Out[2]: array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
#创建一个3 * 5 的浮点型数组,数组的值都是1.
#numpy.ones(shape, dtype = None, order = 'C或F')
In [3]: np.ones((3,5),dtype=float)
Out[3]:
array([[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.]])
#创建一个3 * 5 的浮点型数组,数组的值都是3.14
In [4]: np.full((3,5),3.14)
Out[4]:
array([[3.14, 3.14, 3.14, 3.14, 3.14],
[3.14, 3.14, 3.14, 3.14, 3.14],
[3.14, 3.14, 3.14, 3.14, 3.14]])
#创建一个线性序列数组,从0开始,20结束,步长为2 [与内置的range函数类似]
In [5]: np.arange(0,20,2)
Out[5]: array([ 0, 2, 4, 6, 8, 10, 12, 14, 16, 18])
#创建一个3*3的,在0~1均匀分布的随机数组成的数组
In [7]: np.random.normal(0,1,(3,3))
Out[7]:
array([[ 0.97341698, 0.88933442, 0.22194868],
[-1.71214362, 0.45802193, -1.2897651 ],
[-0.09084611, 1.18721238, -1.16374604]])
#创建一个3*3的,在[0,10)随机整数组成的数组
In [8]: np.random.randint(0,10,(3,3))
Out[8]:
array([[9, 4, 5],
[7, 6, 1],
[0, 6, 0]])
#创建一个3*3的单位矩阵
In [9]: np.eye(3)
Out[9]:
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
#创建一个由3个整数型组成的未初始化的数组
#数组的值是内存空间中的任意值
#numpy.empty(shape, dtype = float, order = 'C或F')
In [10]: np.empty(3)
Out[10]: array([1., 1., 1.])
#复数
In [2]: a = np.array([1,2,3],dtype = complex)
In [3]: a
Out[3]: array([1.+0.j, 2.+0.j, 3.+0.j])
#创建一个对数数列,等比
#np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)
In [12]: a = np.logspace(0,9,num=10)
In [13]: a
Out[13]:
array([1.e+00, 1.e+01, 1.e+02, 1.e+03, 1.e+04, 1.e+05, 1.e+06, 1.e+07,
1.e+08, 1.e+09])
In [14]: b = np.logspace(0,9,10,base=2)
In [15]: b
Out[15]: array([ 1., 2., 4., 8., 16., 32., 64., 128., 256., 512.])
#创建一个在0~1之间均匀取5个值的数组,等差
#np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
In [6]: np.linspace(0,1,5)
Out[6]: array([0. , 0.25, 0.5 , 0.75, 1. ])
#numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0) 接受 buffer 输入参数,以流的形式读入转化成 ndarray 对象。
#buffer 是字符串的时候,Python3 默认 str 是 Unicode 类型,所以要转成 bytestring 在原 str 前加上 b。
In [21]: s = b'Hello'
In [22]: a = np.frombuffer(s,dtype='S1')
In [25]: a
Out[25]: array([b'H', b'e', b'l', b'l', b'o'], dtype='|S1')
#numpy.fromiter(iterable, dtype, count=-1)从可迭代对象中建立 ndarray 对象,返回一维数组。
In [26]: list = range(5)
In [27]: it = iter(list)
In [28]: x = np.fromiter(it,dtype=float)
In [29]: x
Out[29]: array([0., 1., 2., 3., 4.])