KL变换（PCA主成分分析）

原创

谁唱江南断肠句 2023-12-13 11:06:31 ©著作权

文章标签 机器学习 UX 方差协方差 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者谁唱江南断肠句的原创作品，请联系作者获取转载授权，否则将追究法律责任

K-L 变换

在机器学习学习中若存在维度过高的向量，则不利于分析向量的样本的方差与均值

原理分析

K-L变换的本质是寻找一个算子 $KL变换（PCA主成分分析）_协方差$ ，通过 $KL变换（PCA主成分分析）_机器学习_02$ ，其中 $KL变换（PCA主成分分析）_协方差_03$ 为 $KL变换（PCA主成分分析）_方差_04$ 降维后的结果。

存在一个样本集 $KL变换（PCA主成分分析）_机器学习_05$ ，其中 $KL变换（PCA主成分分析）_机器学习_06$ 为 $KL变换（PCA主成分分析）_协方差_07$ 维向量，为了使 $KL变换（PCA主成分分析）_方差_08$ 降低维度

设存在一个线性变换 $KL变换（PCA主成分分析）_协方差$ ，使得$ y_i=U x_i $KL变换（PCA主成分分析）_方差_10$ y_i $KL变换（PCA主成分分析）_方差_11$ k$维向量，

为了使 $KL变换（PCA主成分分析）_协方差_03$ 各个特征最大的限度分开，我们应该从中 $KL变换（PCA主成分分析）_协方差_07$ 个特征中选择 $KL变换（PCA主成分分析）_协方差_14$ 个最大限度可分不重叠的特征。其中各个线性可分的特征应该是不相关的，即他们的相关系数为0。可推出它的协方差为0。

相关系数：
$KL变换（PCA主成分分析）_方差_15$
协方差矩阵：
$KL变换（PCA主成分分析）_方差_16$
$KL变换（PCA主成分分析）_方差_17$

**目标：**将一组 $KL变换（PCA主成分分析）_协方差_07$ 维向量降为 $KL变换（PCA主成分分析）_协方差_14$ 维，其目标是选择 $KL变换（PCA主成分分析）_协方差_14$ 个单位正交基，使得原始数据变换到这组基上后，各变量两两间协方差为 0，而变量方差则尽可能大。

因为 $KL变换（PCA主成分分析）_协方差_03$ 的特征要尽可能的无关，则 $KL变换（PCA主成分分析）_方差_22$

由此 $KL变换（PCA主成分分析）_协方差_03$ 的相关系数矩阵为一个对角矩阵
$KL变换（PCA主成分分析）_协方差_24$
其中 $KL变换（PCA主成分分析）_协方差_25$ 为实对称矩阵，它一定存在 $KL变换（PCA主成分分析）_协方差_07$ 个特征向量，且相互可以正交。

令 $KL变换（PCA主成分分析）_方差_27$ ，则一定满足 $KL变换（PCA主成分分析）_方差_28$ ， $KL变换（PCA主成分分析）_机器学习_29$ 与 $KL变换（PCA主成分分析）_协方差_30$ 分别为特征向量与特征值，取前 $KL变换（PCA主成分分析）_协方差_14$ 大的特征值对于的特征向量，并进行归一化，记为 $KL变换（PCA主成分分析）_协方差$
$KL变换（PCA主成分分析）_协方差_33$

即通过K-L变换，实际上是找到了一个新的坐标系，在这个坐标系中，数据的协方差矩阵是对角的，而且对角线上的元素是原始数据协方差矩阵的特征值，这些特征值对应的特征向量则构成了新坐标系的基向量。

步骤

计算 $KL变换（PCA主成分分析）_方差_34$ 的协方差矩阵 $KL变换（PCA主成分分析）_协方差_35$ ，并记为 $KL变换（PCA主成分分析）_UX_36$
计算 $KL变换（PCA主成分分析）_UX_36$ 的特征值与特征向量
取前 $KL变换（PCA主成分分析）_方差_38$ 大的特征值对于的特征向量，并进行归一化，记为 $KL变换（PCA主成分分析）_UX_39$
利用 $KL变换（PCA主成分分析）_机器学习_40$ 进行降维度处理

示例

有样本集 $KL变换（PCA主成分分析）_机器学习_41$ , $KL变换（PCA主成分分析）_UX_42$ ,请用K-L变换将特征降至2维和1维，并画出在该空间中的位置

1、计算样本均值

$KL变换（PCA主成分分析）_UX_43$ 的均值 $KL变换（PCA主成分分析）_机器学习_44$

$KL变换（PCA主成分分析）_协方差_45$ 的均值 $KL变换（PCA主成分分析）_机器学习_46$

总体样本的均值 $KL变换（PCA主成分分析）_机器学习_47$

2、去中心化
$KL变换（PCA主成分分析）_方差_48$

$KL变换（PCA主成分分析）_方差_49$

令 $KL变换（PCA主成分分析）_方差_50$
$KL变换（PCA主成分分析）_UX_51$
计算特征值与特征向量
$KL变换（PCA主成分分析）_协方差_52$
选取 $KL变换（PCA主成分分析）_机器学习_53$
$KL变换（PCA主成分分析）_机器学习_54$
其余同理可得。

import numpy as np

# 样本数据
w1 = np.array([[0, 0, 0], [1, 0, 0], [1, 0, 1], [1, 1, 0]])
w2 = np.array([[0, 0, 1], [0, 1, 0], [0, 1, 1], [1, 1, 1]])

u = (w1.mean(axis=0) + w2.mean(axis=0)) / 2

x1 = w1 - u
x2 = w2 - u
x = np.zeros((3, 3))

for i in x1:
    i = i.reshape(3, -1)
    x = x + i @ i.T

for i in x2:
    i = i.reshape(3, -1)
    x = x + i @ i.T

x = x / 8

lambda_value, vector = np.linalg.eigh(x)

U2d = vector[:2]
U1d = vector[0]

x2d_1 = (U2d @ x1.T).T
x2d_2 = (U2d @ x2.T).T

x1d_1 = (U1d @ x1.T).T
x1d_2 = (U1d @ x2.T).T