①线性判别分析(LDA)的思想

LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。LDA的思想可以用一句话概括,我们希望同一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大。(这和聚类很接近)LDA的分类效果如下图所示:

采用LDA算法对加密的人脸图像进行特征提取 lda算法分类_多分类

可以看出2图的分类效果最好,更像分类的结果,所以我们的优化方向就是分类后类内方差最小,类间方差最大

②LDA算法的原理

(1)二类LDA原理

采用LDA算法对加密的人脸图像进行特征提取 lda算法分类_方差_02

是第j类样本的均值,这是为了方便计算以平均值为度量的类间距离。

其中下面这一个公式的实际意义就是,算法的目标就是要找到一个最佳投影向量使得这个值最大,就是算法训练出来的结果

(2)多分类LDA算法

采用LDA算法对加密的人脸图像进行特征提取 lda算法分类_多分类_03


J(W)表示类间方差除以类内方差,极大化它就是说弄大类间方差的同时缩小类内方差。其中W是投影的基向量的集合(投影矩阵),我们机器学习算法的目的就是求出这个。③算法流程和用途

采用LDA算法对加密的人脸图像进行特征提取 lda算法分类_数据_04

这个算法的用途:

①LDA除了可以用于降维

②分类:一个常见的LDA分类基本思想是假设各个类别的样本数据符合高斯分布,这样利用LDA进行投影后,可以利用极大似然估计计算各个类别投影数据的均值和方差,进而得到该类别在最佳投影下高斯分布的概率密度函数。当一个新的样本到来后,我们可以将它投影,然后将投影后的样本特征分别带入各个类别的高斯分布概率密度函数,计算它属于这个类别的概率,最大的概率对应的类别即为预测类别。如下图所示

采用LDA算法对加密的人脸图像进行特征提取 lda算法分类_方差_05

(3)特点:从数据之中找规律的有监督学习,适用于多分类问题,并且可解释性强。