每种都有哪些优点和缺点?

从我所看到的情况来看,如果需要的话,任何一个都可以替代另一个,所以我应该同时使用这两个还是应该坚持使用其中一个?

程序的样式会影响我的选择吗? 我正在使用numpy进行一些机器学习,因此确实有很多矩阵,但也有很多向量(数组)。

#1楼

*'array'或'matrix'? 我应该使用哪个? -简短答案

使用数组。

它们是numpy的标准向量/矩阵/张量类型。 许多numpy函数返回数组,而不是矩阵。

在逐元素运算和线性代数运算之间有明显的区别。

如果愿意,可以有标准向量或行/列向量。

使用数组类型的唯一缺点是,您将不得不使用dot而不是*来乘(减少)两个张量(标量积,矩阵向量乘法等)。

#2楼

正如其他人提到的那样, matrix的主要优点也许是它为矩阵乘法提供了一种方便的表示法。

在最新的NumPy版本中,它可以与ndarray一起使用:

A = numpy.ones((1, 3))
B = numpy.ones((3, 3))
A @ B

因此,如今,如果有更多疑问,您应该坚持使用ndarray 。


numpy矩阵严格是二维的,而numpy数组(ndarrays)是N维的。 矩阵对象是ndarray的子类,因此它们继承了ndarray的所有属性和方法。

numpy矩阵的主要优点是它们为矩阵乘法提供了一种方便的表示法:如果a和b是矩阵,则a * b是它们的矩阵乘积。

import numpy as np
a=np.mat('4 3; 2 1')
b=np.mat('1 2; 3 4')
print(a)
# [[4 3]
# [2 1]]
print(b)
# [[1 2]
# [3 4]]
print(a*b)
# [[13 20]
# [ 5 8]]

另一方面,从Python 3.5开始,NumPy使用@运算符支持中缀矩阵乘法,因此您可以在Python> = 3.5中使用ndarrays实现相同的矩阵乘法便利。

import numpy as np
a=np.array([[4, 3], [2, 1]])
b=np.array([[1, 2], [3, 4]])
print(a@b)
# [[13 20]
# [ 5 8]]

矩阵对象和ndarray都具有.T以返回转置,但是矩阵对象也具有.H表示共轭转置,而.I表示逆转。

相反,numpy数组始终遵守以元素为单位应用操作的规则(新的@运算符除外)。 因此,如果a和b是numpy数组,则a*b是通过逐个乘以组件而形成的数组:

c=np.array([[4, 3], [2, 1]])
d=np.array([[1, 2], [3, 4]])
print(c*d)
# [[4 6]
# [6 4]]

要获得矩阵乘法的结果,请使用np.dot (或在Python> = 3.5中使用@ ,如上所示):

print(np.dot(c,d))
# [[13 20]
# [ 5 8]]
**运算符的行为也有所不同:
print(a**2)
# [[22 15]
# [10 7]]
print(c**2)
# [[16 9]
# [ 4 1]]

由于a是矩阵,因此a**2返回矩阵乘积a*a 。 由于c是一个ndarray,因此c**2返回一个ndarray,每个组件的元素均平方。

矩阵对象和ndarray之间还有其他技术区别(与np.ravel,项目选择和序列行为有关)。

numpy数组的主要优点是它们比二维矩阵更通用。 当您需要3维数组时会发生什么? 然后,您必须使用ndarray,而不是矩阵对象。 因此,学习使用矩阵对象的工作量更大-您必须学习矩阵对象操作和ndarray操作。

编写同时使用矩阵和数组的程序会使您的生活变得困难,因为您必须跟踪变量是什么类型的对象,以免乘法返回意外的结果。

相反,如果仅使用ndarray,则可以执行矩阵对象可以执行的所有操作,以及更多操作,但功能/符号略有不同。

如果您愿意放弃NumPy矩阵产品表示法的视觉吸引力(使用python> = 3.5的ndarrays几乎可以优雅地实现),那么我认为NumPy数组绝对是可行的方法。

PS。 当然,由于np.asmatrix和np.asarray允许您将一个转换为另一个(只要数组是二维的),因此您实际上不必选择一个来牺牲另一个。

还有就是与NumPy之间的差异大纲arrays VS NumPy的matrix ES 在这里 。


只是将一个案例添加到unutbu的列表中。

与numpy矩阵或矩阵语言(如matlab)相比,numpy ndarray对我而言最大的实际差异之一是,在归约运算中未保留维。 矩阵始终为2d,而数组的均值则少一维。

例如,矩阵或数组的行为不佳的行:

带矩阵
>>> m = np.mat([[1,2],[2,3]])
>>> m
matrix([[1, 2],
[2, 3]])
>>> mm = m.mean(1)
>>> mm
matrix([[ 1.5],
[ 2.5]])
>>> mm.shape
(2, 1)
>>> m - mm
matrix([[-0.5, 0.5],
[-0.5, 0.5]])
带阵列
>>> a = np.array([[1,2],[2,3]])
>>> a
array([[1, 2],
[2, 3]])
>>> am = a.mean(1)
>>> am.shape
(2,)
>>> am
array([ 1.5, 2.5])
>>> a - am #wrong
array([[-0.5, -0.5],
[ 0.5, 0.5]])
>>> a - am[:, np.newaxis] #right
array([[-0.5, 0.5],
[-0.5, 0.5]])

我还认为混合数组和矩阵会带来很多“快乐的”调试时间。 但是,就乘法而言,scipy.sparse矩阵始终是矩阵。