目录

NumPy的对象-ndarray

创建一个numpy对象

NumPy数组属性

numpy.empty

numpy.ones&&numpy.zeros

numpy.asarray

numpy.arange

 numpy.linspace

numpy.logspace

NumPy 运算


NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 通常与 SciPy(Scientific Python)和 Matplotlib(绘图库)一起使用, 这种组合广泛用于替代 MatLab,是一个强大的科学计算环境,有助于我们通过 Python 学习数据科学或者机器学习。

NumPy的对象-ndarray

NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。 ndarray 对象是用于存放同类型元素的多维数组(矩阵)。 ndarray 中的每个元素在内存中都有相同存储大小的区域。

ndarray 内部由以下内容组成:

  • 一个指向数据(内存或内存映射文件中的一块数据)的指针。
  • 数据类型或 dtype,描述在数组中的固定大小值的格子。
  • 一个表示数组形状(shape)的元组,表示各维度大小的元组。
  • 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。

创建一个numpy对象

创建一个 ndarray 只需调用 NumPy 的 array 函数即可

numpy.array(object,dtype=None,copy=True,order=None,subok=False,ndmin=0)

参数

说明

object    

数组或嵌套的数列

dtype    

数组元素的数据类型,可选

copy    

对象是否需要复制,可选

order    

创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)

subok    

默认返回一个与基类类型一致的数组

ndmin   

指定生成数组的最小维度

实例:

深度学习 kaggle预测房价 房价预测数据挖掘_深度学习 kaggle预测房价

 numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。常用 NumPy 基本类型如下:

名称 

描述

bool_

布尔型数据类型(True 或者 False)

int_

默认的整数类型(类似于 C 语言中的 long,int32 或 int64)

intc

与 C 的 int 类型一样,一般是 int32 或 int 64

intp

用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64)

int8

字节(-128 to 127)

int16

整数(-32768 to 32767)

int32

整数(-2147483648 to 2147483647)

int64

整数(-9223372036854775808 to 9223372036854775807)

NumPy数组属性

NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度,一维数组的秩为 1,二维数组的秩为 2,以此类推。 在 NumPy中,每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)。 很多时候可以声明 axis。axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。

具体的属性说明如下表:

属性

说明

ndarray.ndim

秩,即轴的数量或维度的数量

ndarray.shape

数组的维度,对于矩阵,n 行 m 列

ndarray.size

数组元素的总个数,相当于 .shape 中 n*m 的值

ndarray.dtype

ndarray 对象的元素类型

ndarray.itemsize

ndarray 对象中每个元素的大小,以字节为单位

ndarray.flags

ndarray 对象的内存信息

ndarray.real

ndarray元素的实部

ndarray.imag

ndarray 元素的虚部

ndarray.data

包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。

实例:

深度学习 kaggle预测房价 房价预测数据挖掘_NumPy_02

numpy.empty

numpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组:

numpy.empty(shape, dtype = float, order = 'C')

参数

描述

shape

数组形状

dtype

数据类型,可选

order

有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序。

numpy.ones&&numpy.zeros

创建指定形状的数组,数组元素以 1 来填充:

numpy.ones(shape, dtype = None, order = 'C')

 创建指定大小的数组,数组元素以 0 来填充:

numpy.zeros(shape, dtype = float, order = 'C')

 

参数

描述

shape

数组形状

dtype

数据类型,可选

order

'C' 用于 C 的行数组,或者 'F' 用于 FORTRAN 的列数组

 实例:

深度学习 kaggle预测房价 房价预测数据挖掘_深度学习 kaggle预测房价_03

numpy.asarray

numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。

numpy.asarray(a, dtype = None, order = None)

参数

描述

a

任意形式的输入参数,可以是,列表, 列表的元组, 元组, 元组的元组, 元组的列表,多维数组

dtype

数据类型,可选

order

可选,有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序

numpy.arange

numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下:

numpy.arange(start, stop, step, dtype)

 根据 start 与 stop 指定的范围以及 step 设定的步长,生成一个 ndarray。

参数

描述

start

起始值,默认为0

stop

终止值(不包含)

step

步长,默认为1

dtype

返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。

 numpy.linspace

numpy.linspace 函数用于创建一个一维数组,数组是一个等差数列构成的,格式如下:

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

 

参数

描述

start

序列的起始值

stop

序列的终止值,如果endpointtrue,该值包含于数列中

num

要生成的等步长的样本数量,默认为50

endpoint

该值为 true 时,数列中包含stop值,反之不包含,默认是True。

retstep

如果为 True 时,生成的数组中会显示间距,反之不显示。

dtype

ndarray 的数据类型

numpy.logspace

numpy.logspace 函数用于创建一个于等比数列。格式如下:

np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

参数

描述

start

序列的起始值为:base ** start

stop

序列的终止值为:base ** stop。如果endpointtrue,该值包含于数列中

num

要生成的等步长的样本数量,默认为50

endpoint

该值为 true 时,数列中中包含stop值,反之不包含,默认是True。

base

对数 log 的底数。

dtype

ndarray 的数据类型

 实例:

深度学习 kaggle预测房价 房价预测数据挖掘_数据类型_04

NumPy 运算

加减乘除:add()subtract()multiply() 和 divide()

实例

a = np.arange(9, dtype = np.float_).reshape(3,3)  
print ('第一个数组:')
print (a)
print ('第二个数组:')
b = np.array([10,10,10])  
print (b)
print ('两个数组相加:')
print (np.add(a,b))
print ('两个数组相减:')
print (np.subtract(a,b))
print ('两个数组相乘:')
print (np.multiply(a,b))
print ('两个数组相除:')
print (np.divide(a,b))

深度学习 kaggle预测房价 房价预测数据挖掘_Numpy_05

numpy.amin() 和 numpy.amax()

numpy.amin() 用于计算数组中的元素沿指定轴的最小值。

numpy.amax() 用于计算数组中的元素沿指定轴的最大值。

numpy.median()

numpy.median() 函数用于计算数组 a 中元素的中位数(中值)

numpy.mean()和numpy.average()

numpy.mean() 函数返回数组中元素的算术平均值。

numpy.average() 函数根据在另一个数组中给出的各自的权重计算数组中元素的加权平均值。

numpy.sort()

numpy.sort() 函数返回输入数组的排序副本。函数格式如下:

numpy.sort(a, axis, kind, order)
  • axis: 沿着它排序数组的轴,如果没有数组会被展开,沿着最后的轴排序, axis=0 按列排序,axis=1 按行排序
  • kind: 默认为'quicksort'(快速排序)
  • order: 如果数组包含字段,则是要排序的字段

实例:

深度学习 kaggle预测房价 房价预测数据挖掘_NumPy_06