R语言princomp计算特征值 r语言求特征值

转载

墨色天香 2023-11-08 00:08:26

文章标签 R语言princomp计算特征值 gram矩阵 matlab jacobi算法求特征值 matlab qr分解求特征值值对于int32太大或太小 文章分类 R语言后端开发

R语言princomp计算特征值 r语言求特征值_matlab jacobi算法求特征值

数据分析、信号处理和机器学习中的矩阵方法

第12讲计算特征值和奇异值

新MIT 线性代数|机器学习（中英机翻字幕）18.065 by Gilbert Strang_哔哩哔哩 (゜-゜)つロ干杯~-bilibiliwww.bilibili.com

R语言princomp计算特征值 r语言求特征值_matlab qr分解求特征值_02

这并不是数值线性代数课程，但我们需要探讨如何计算特征值和奇异值。你可以调用eig或svd或Python以及Julia中的等效程序，但仍需要了解相关知识。

特征值计算

首先谈QR分解，矩阵

。矩阵

R在非正交矩阵 A和正交矩阵 Q之间建立了联系。

取

，则

，两矩阵相似，因此矩阵

A1和矩阵 A0具有相同的特征值。继续在这个操作构造矩阵，矩阵 An对角线以下的元素会变得越来越小，而对角线元素会越来越接近于特征值。

例：

，则有

，对角线下元素取了立方，再变换一步会再取立方变为9次方……

这个方法迅速淘汰了所有其他用于计算特征值的方法。但做数值计算的人希望进一步改进。

引入一个平移矩阵，得到

，它具有和原矩阵相同的特征向量，而特征值改变了s，

。

对该矩阵进行QR分解，得到

，将分解矩阵反向相乘并反向平移变换构造矩阵

。则矩阵

A1和矩阵 A0为相似矩阵，具有相同特征值。

这样处理的好处是使得特征值收敛得更快。

假设我们的矩阵已经有一些零，比如说通过一些操作得到了有一条下对角线的矩阵。

R语言princomp计算特征值 r语言求特征值_值对于int32太大或太小_03

实际上是很难把矩阵通过相似变换直接得到上三角矩阵的，因为那意味着我能够很容易的得到特征值，而特征值计算对应一个一元高次方程，而高于5次的方程是没有代数解法的。从这个角度说求特征值比用高斯消元解Ax=b（得到上对角阵U）、求逆矩阵等更困难。我们通过QR方法，是尽可能逼近特征值。

因此求取特征值的第一步是通过相似变换得到如上图的上Hessenburg矩阵，它由一个上三角阵和一条下对角线组成。

第二步是通过带有平移操作的QR分解得到特征值。

这也是MATLAB中eig(A)的操作内容，你可以从线代数据包LAPACK中获得代码，了解数值计算过程。

如果矩阵A0是对称的，会发现A1也对称，最后会得到“对称的Hessenburg矩阵”，即三对角矩阵。矩阵不是n的平方个数组成的，只有2n个数，因为上对角线和下对角线是相同的。

R语言princomp计算特征值 r语言求特征值_gram矩阵_04

这就是eig方法求特征值的过程，这算法的真正核心是QR，不要再试着去求解行列式

，它把n平方个信息压缩到n个系数里，所以你会丢失很多信息。

奇异值计算

下面讨论奇异值，不要一上来就用

进行计算。前面已经讨论过，我们可以将对称矩阵

S通过相似矩阵

变成一个三对角阵，而不改变其特征值，而奇异值有没有对应的处理方法？

矩阵的SVD分解为

，会发现

不会改变矩阵的奇异值，因为左侧两个正交矩阵的乘积

QU依旧是正交矩阵。

可验证

QU是正交矩阵。

而SVD分解的右侧可以乘以任意正交矩阵，而并非Q矩阵的转置，因为奇异值矩阵没有发生变化，而两侧仍是正交矩阵，即

。这比之前求特征值的方法有了更大的灵活性，最终矩阵

A可以被处理为双对角线矩阵。

R语言princomp计算特征值 r语言求特征值_R语言princomp计算特征值_05

而对于

，如果直接处理得到的就是三对角矩阵，如果将矩阵

A变换得到的二对角矩阵与其转置相乘也得到三对角矩阵。

两套处理方法都是先通过相似变换得到具有很多零的稀疏矩阵，然后再通过带平移操作的QR分解得到特征值或者奇异值。对于1000阶以下的矩阵，这些就是eig和SVD命令的基本操作。

Krylov方法

当n太大时（例如矩阵A的大小为100万），需要用Krylov方法。从向量b开始，将其乘以A得到Ab……然后一直到

，得到100维的Krylov空间。它将矩阵限制在这个100维的空间中，而这个子空间就可以捕获特征向量。向量

v表示为线性组合：

这个误差是可以忽略的。当向量乘以A时，所得向量有存在于Krylov空间k100中的部分，也有在k100之外的部分，而我们忽略了后一部分。

我只是花几分钟来解释Krylov的想法可以做些什么。通过构造Krylov向量得到这种特定类型的子空间，通过Gram-schmidt快速获得它的基向量，考察一下矩阵在该空间中的作用，可以寻找到限于该空间的特征值。所以转化为100 x 100的问题（矩阵A通过100个Krylov空间中的正交向量变换），然后找到该矩阵的特征值，它们是原特征值的一个很好的近似。但是我可能不确定这个想法会给前100个特征值，它们不是完美的特征值，但有一定精度。

下一步将讨论随机抽样。如果您的矩阵太大了，需要进行随机抽样，这是一个非常新的想法，是数值线性代数中的一个非常不同的想法。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。