简单来说,Numpy 是 Python 的一个科学计算包,包含了多维数组以及多维数组的操作。Numpy 的核心是 ndarray 对象,这个对象封装了同质数据类型的n维数组。起名 ndarray 的原因就是因为是 n-dimension-array 的简写。ndarray中的每个元素在内存中使用相同大小的块。 ndarray中的每个元素是数据类型对象的对象(称为 dtype)。

一、构建ndarray:从Python列表创建数组

import  numpy as np

np.array()

    np.array(object, dtype=None)

object:转换的数据

dtype : 数据类型

二、数据类型

Numpy 中的数组比 Python 原生中的数组(只支持整数类型与浮点类型)强大的一点就是它支持更多的数据类型。

python ndarray dtype 转为uint8 numpy array dtype_数组

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

请记住,不同于 Python 列表,NumPy 要求数组必须包含同一类型的数据。如果类型不匹配,NumPy 将会向上转换(如果可行)。

让我们来领会一下什么叫做向上转换:整数-小数-字符串……

三、Numpy 的矢量化(向量化)功能

a = [[1, 2, 3], [5, 7, 8], [4, 5, 6]]
b = [[6, 2, 1], [2, 3, 1], [4, 5, 6]]

# 转换nparray
a1 = np.array(a)
b1=  np.array(b)

a1 + b1
a1*b1
a1 / b1
a1 + 5
a1 * 3
a1 ** 2

for循环是“遍历”,python数据类型是不一样的,但是在Numpy中数据是一样的,矢量化是“一次性”,这就是数组运算的意思。

矢量化代码有很多优点,其中包括:

  • 矢量化代码更简洁易读
  • 更少的代码行通常意味着更少的错误
  • 该代码更接近地类似于标准数学符号(使得更容易,通常,以正确地编码数学构造)
  • 矢量化导致更多的“Pythonic”代码。如果没有向量化,我们的代码将会效率很低,难以读取for循环。

四、创建常用的数组

单位矩阵,全零矩阵,三角矩阵等常用的矩阵数组,在线性代数的辅助计算中有很多特殊的作用。下面我们来看一下如何创建这些矩阵数组:

1.全0数组

np.zeros((3, 5))

2.全1数组

np.ones([4,3])

3.单位矩阵

np.eye(3, dtype=int)

4.空矩阵

np.empty(10)
#空矩阵里面的值是没有意义的

5.对角矩阵

np.diag([1, 5, 300, 444, 44, 666, 77])

6.设定具体的值

np.full((3, 5),3.14 )

7.设置空值

f=np.nan

8.设置无穷大

np.inf

9.随机数组

np.random.randint(1, 10, (3, 6)) #随机整数数组
np.random.rand(3,3)#生成0-1之间的随机数组

  

10.正态分布

#标准正态分布
np.random.randn(4, 5 )
# 均值, 标准差, 形状
np.random.normal(4, 2, (10, 3))
# 生成t分布, df 自由度  
np.random.standard_t(10 , (3,3))

# 卡方分布
np.random.chisquare(10 , (3,4))


# F分布 , 分子自由度, 分母自由度
np.random.f(2,3, (3,4))

11.随机数种子

# 随机数种子
np.random.seed(666)
np.random.randint(0,10, (3,3))

12.创建一个线性序列的数组

arange([start,] stop[, step,])

特点: 可以设置开始位置,终止位置和步长,但产生数字的数量不方便控制

np.arange(0, 20, 4)



np.linspace(开始位置, 终止位置, 产生数量)

特点: 可以设置开始位置和终止位置以及产生数量,但不方便控制步长

# 从 0 - 10  个数 28个
np.linspace(0 , 10 , 28)

 arange是左闭右开,linspace闭区间。

五、数组的索引和切片

Python 中原生的数组就支持使用方括号([])进行索引和切片操作,Numpy 也同样具有这个强大的特性。

#单个元素的索引
x = np.arange(10)
x[2]

与Python原生的列表、元组不同的是,Numpy数组支持多维数组的多维索引。每一个逗号, 代表索引的一个维度。

#二维数组的索引
x2[0::2,0::3]
#修改某一个元素
x1[1] = 3.1415926  # 类型会自动转换

可以使用切片和步长来截取不同长度的数组,使用方式与Python原生的对列表和元组的方式相同。语法和之前学过的列表的切片是一样的。

x[start:stop:step]

注意:关于数组切片有一点很重要也非常有用,那就是数组切片返回的是 数组数据的视图,而不是数值数据的副本。这一点也是 NumPy 数 组切片和 Python 列表切片的不同之处:在 Python 列表中,切片是 值的副本。

六、复制和视图

完全不复制

视图(浅复制)

完全复制(深复制)

视图:不同的数组对象可以共享相同的数据。view方法创建一个新数组对象,该对象看到相同的数据。与前一种情况不同,新数组的维数更改不会更改原始数据的维数,但是新数组数据更改后,也会影响原始数据

 

 重点:矢量化运算  , 生成随机数, 索引和切片, 浅复制(视图)