NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库
本系列文章针对Numy进行一个比较系统的回顾
一般在python中我们会对Numpy进行缩写
import numpy as np
因此后续中的np均指numpy

1.常量

名称

类型

np.nan

空值

np.inf

无穷大

np.pi

圆周率

np.e

自然对数

import numpy as np
np.e



2.718281828459045

2.数据类型

Python 原生的数据类型相对较少, bool、int、float、str等。这在不需要关心数据在计算机中表示的所有方式的应用中是方便的。然而,对于科学计算,通常需要更多的控制。为了加以区分 numpy 在这些类型名称末尾都加了“_”

类型

大小

说明

bool_ / bool8

8

布尔

int8/byte

8

整数

int16/short

16

整数

int32/intc

32

整数

int_/int64/long/intp

64

整数

uint8/ubyte

8

无符号整数

uint16/ushort

16

无符号整数

uint32/uintc

32

无符号整数

uint64/uintp/uint0/uint

64

无符号整数

float16/half

16

浮点型

float32/single

32

浮点型

float_/float64/double

64

浮点型

str/unicode/str0/unicode

-

字符串

datetime64

-

日期时间类型

timedelta64

-

表示两个时间之间的间隔

如何查看数据的类型呢?



import numpy as np
a = np.dtype('float64')
print(a.type)



<class 'numpy.float64'>

如何查看数据的信息呢?



import numpy as np

ii16 = np.iinfo(np.int16)
print(ii16.min)  # -32768
print(ii16.max)  # 32767



-32768
32767

表示int16最大值为32767 最小值为-32768

至于原因的话 和二进制有关系 int16表示有16个格子




python中netsnmp包 python import numpy as np_python中netsnmp包


那么只有15个格子是用来进行二进制填充 2**15=32768 所以最大值即为32767

为什么最大值比二进制值少一位?

涉及到计算机补码的问题 可以参考一下这个博客

blog.csdn.net


3.时间日期和时间增量

numpy 中,我们很方便的将字符串转换成时间日期类型 datetime64datetime 已被 python 包含的日期时间库所占用)。

datatime64是带单位的日期时间类型,其单位如下:

日期单位

含义

时间单位

含义

Y


h

小时

M


m

分钟

W


s


D


ms

毫秒

us

微秒

ns

纳秒

ps

皮秒

fs

飞秒

as

阿托秒

a = np.datetime64('2020-03-01')
print(a, a.dtype)  # 2020-03-01 datetime64[D]


2020-03-01 datetime64[D]

4.数组

numpy 提供的最重要的数据结构是ndarray,它是 python 中list的扩展。

比如一维数组


a = np.array([0, 1, 2, 3, 4])
print(a, type(a))


# [0 1 2 3 4] <class 'numpy.ndarray'>

比如二维数组


c = np.array([[11, 12, 13, 14, 15],
              [16, 17, 18, 19, 20],
              [21, 22, 23, 24, 25],
              [26, 27, 28, 29, 30],
              [31, 32, 33, 34, 35]])
print(c, type(c))


# [[11 12 13 14 15]
# [16 17 18 19 20]
# [21 22 23 24 25]
# [26 27 28 29 30]
# [31 32 33 34 35]] <class 'numpy.ndarray'>

array()asarray()都可以将结构数据转化为 ndarray,但是array()asarray()主要区别就是当数据源是ndarray时,array()仍然会 copy 出一个副本,占用新的内存,但不改变 dtype 时asarray()不会。


x = [[1, 1, 1], [1, 1, 1], [1, 1, 1]]
y = np.array(x)
z = np.asarray(x)
x[1][2] = 2
print(x,type(x))
print(y,type(y))
print(z,type(z))


# [[1, 1, 1], [1, 1, 2], [1, 1, 1]] <class 'list'>

# [[1 1 1]# [1 1 1]# [1 1 1]] <class 'numpy.ndarray'>

# [[1 1 1]# [1 1 1]# [1 1 1]] <class 'numpy.ndarray'>

数组中有2个比较特殊的数组,分别为0 数组和1数组

  • zeros()函数:返回给定形状和类型的零数组。
  • zeros_like()函数:返回与给定数组形状和类型相同的零数组。
  • ones()函数:返回给定形状和类型的1数组。
  • ones_like()函数:返回与给定数组形状和类型相同的1数组。
x = np.zeros(5)
print(x)  #


[0. 0. 0. 0. 0.]


x = np.zeros([2,3])
print(x)


[[0. 0. 0.]

[0. 0. 0.]]


x = np.ones(5)
print(x)


[1. 1. 1. 1. 1.]


x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.ones_like(x)
#ones_like()函数:返回与给定数组形状和类型相同的1数组。


[[1 1 1]
[1 1 1]]

随机数组

  • empty()函数:返回一个空数组,数组元素为随机数。
  • empty_like函数:返回与给定数组具有相同形状和类型的新数组。
x = np.empty(5)
print(x)


[1.95821574e-306 1.60219035e-306 1.37961506e-306
9.34609790e-307 1.24610383e-306]

单位数组

  • eye()函数:返回一个对角线上为1,其它地方为零的单位数组。
  • identity()函数:返回一个方的单位数组。
x = np.eye(4)
print(x)


[[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]]

对角数组

diag()函数:提取对角线或构造对角数组。


v = [1, 3, 5, 7]
x = np.diag(v)
print(x)


[[1 0 0 0]
[0 3 0 0]
[0 0 5 0]
[0 0 0 7]]

常数值

  • full()函数:返回一个常数数组。
  • full_like()函数:返回与给定数组具有相同形状和类型的常数数组。
x = np.full((2, 7), 7)
print(x)


[[7 7 7 7 7 7 7]
[7 7 7 7 7 7 7]]

利用数值范围来创建ndarray

  • arange()函数:返回给定间隔内的均匀间隔的值。
  • linspace()函数:返回指定间隔内的等间隔数字。
  • logspace()函数:返回数以对数刻度均匀分布。
  • numpy.random.rand() 返回一个由[0,1)内的随机数组成的数组。
x = np.arange(5)
print(x)


[0 1 2 3 4]


x = np.linspace(start=0, stop=2, num=9)
print(x)


[0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ]


x = np.logspace(0, 1, 5)
print(np.around(x, 2))


[ 1. 1.78 3.16 5.62 10. ]


x = np.random.random(5)
print(x)


[0.41768753 0.16315577 0.80167915 0.99690199 0.11812291]

结构数组创建

  • 利用字典来定义结构
personType = np.dtype({
    'names': ['name', 'age', 'weight'],
    'formats': ['U30', 'i8', 'f8']})

a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)],
             dtype=personType)
print(a, type(a))


[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'>

  • 利用包含多个元组的列表来定义结构
personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8')])
a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)],
             dtype=personType)
print(a, type(a))


[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'>

5.数组属性

在使用 numpy 时,你会想知道数组的某些信息。很幸运,在这个包里边包含了很多便捷的方法,可以给你想要的信息。

  • numpy.ndarray.ndim用于返回数组的维数(轴的个数)也称为秩,一维数组的秩为 1,二维数组的秩为 2,以此类推。
  • numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。
  • numpy.ndarray.size数组中所有元素的总量,相当于数组的shape中所有元素的乘积,例如矩阵的元素总量为行与列的乘积。
  • numpy.ndarray.dtype ndarray 对象的元素类型。
  • numpy.ndarray.itemsize以字节的形式返回数组中每一个元素的大小。
a = np.array([1, 2, 3, 4, 5])
print(a.shape)  # (5,)
print(a.dtype)  # int32
print(a.size)  # 5
print(a.ndim)  # 1
print(a.itemsize)  # 4


(5,)
int32
5
1
4