fisher判别分析r语言 fisher怎么判断rs

转载

mob6454cc627440 2023-09-18 07:25:54

文章标签 fisher判别分析r语言多元统计分析 Fisher判别法方差分析线性变换 文章分类 R语言后端开发

文章目录

十五、Fisher判别法

1.Fisher判别法概述
2.如何寻找线性函数
3.Fisher判别准则
回顾总结

十五、Fisher判别法

1.Fisher判别法概述

在直接判别法中，如果我们假象每个类 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法$ 在 $fisher判别分析r语言 fisher怎么判断rs_方差分析_02$ 占据一个空间，那么我们判别样本属于其中的某一类，就以马氏距离（或广义马氏距离）作为标准，换言之，我们可以想象成每一个 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法$ 具有某种“吸引力”，将距离它比较近的样本“拉”过来，这种拉力将 $fisher判别分析r语言 fisher怎么判断rs_方差分析_02$ 分成 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_05$ 个互不相交的区域。如果每个类占据的空间比较近，它们的“拉力界限”会比较模糊，判别的结果就会比较差。

如果存在某种变换，能将不同的类占据的空间分散开来，对样本也施加这种变换后，判别就发生在变换后的空间上，变成界限清晰的判别，这就是Fisher判别的基本思想。由于线性函数在实际应用中最方便，所以我们会使用一个线性函数 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_06$ 进行投影。

我们可以将Fisher判别法视为距离判别法的补充，因为我们之前说过，距离判别对于均值相近的总体效果较差；如果使用投影函数，将原来的总体映射到一个均值能被拉开的一元空间或多元空间上，就能提高分辨的效率。

2.如何寻找线性函数 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_07$

要鉴别是否将不同的类分开，可以运用方差分析的方法，即对比组内平方和与组间平方和的差距。现假设从 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_08$ 中抽取的总体是 $fisher判别分析r语言 fisher怎么判断rs_线性变换_09$ ，则组内离差阵和组间离差阵是
$fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_10$
经过线性变换 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_11$ 的处理后，离差阵变成平方和，即
$fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_12$
所以，根据方差分析的思想（参见《十一、回归方程与回归系数的显著性检验》：1.平方和分解），如果分组足够开，组间平方和 $fisher判别分析r语言 fisher怎么判断rs_线性变换_13$ 与组内平方和 $fisher判别分析r语言 fisher怎么判断rs_线性变换_14$ 的商应该会比较大，即定义
$fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_15$
要求的结果是 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_16$ ，为了对 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_07$ 作出限制，增添一个条件 $fisher判别分析r语言 fisher怎么判断rs_方差分析_18$ ，这样问题就变成了
$fisher判别分析r语言 fisher怎么判断rs_多元统计分析_19$
这是一个带约束求最值问题，使用Lagrange乘数法，得到Lagrange函数是
$fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_20$
由此， $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_21$ 是 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_22$ 的特征根， $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_07$ 是相应的特征向量，且 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_24$ ，也就是说 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_25$ 的最大化问题，实际上是求 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_22$ 的最大特征值和相应特征向量的问题。所以，我们最终结论是：

Fisher线性判别结论：在Fisher准则下，线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_线性变换_27$ 的解 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_28$ ，是特征方程 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_29$ 的最大特征根 $fisher判别分析r语言 fisher怎么判断rs_方差分析_30$ 所对应的特征向量 $fisher判别分析r语言 fisher怎么判断rs_方差分析_31$ ，满足 $fisher判别分析r语言 fisher怎么判断rs_方差分析_32$ ，且相应的判别效率为
$fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_33$

如果一个线性判别函数不能很好区分 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_05$ 个总体，就选择第二大的特征值 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_35$ 对应的特征向量 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_36$ ，以此类推到第三个、第四个……称线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_线性变换_37$ 的累计判别能力为
$fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_38$
这里 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_39$ 是非零特征值总数， $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_40$ 。

3.Fisher判别准则

如果 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_22$ 的非零特征值是 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_40$ ，对应的特征向量是 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_43$ 。这里 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_44$ ，则我们可以建立线性投影函数 $fisher判别分析r语言 fisher怎么判断rs_方差分析_45$ ，将 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_46$ 元数据投影到一维直线上，但此时又应该如何判别？

先考虑 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_47$ 的时候，此时 $fisher判别分析r语言 fisher怎么判断rs_方差分析_48$ ，线性判别函数只有一个： $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_49$ ，现在要求出特征根与特征向量。接下来是特征值求值的推导：
$fisher判别分析r语言 fisher怎么判断rs_方差分析_50$
由于 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_51$ 与 $fisher判别分析r语言 fisher怎么判断rs_线性变换_52$ 的特征值相同，所以 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_22$ 的特征值与 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_54$ 相同，即
$fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_55$
这里 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_56$ ， $fisher判别分析r语言 fisher怎么判断rs_线性变换_57$ 是组内离差阵。与之对应的特征向量 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_58$ 为
$fisher判别分析r语言 fisher怎么判断rs_线性变换_59$
它满足 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_60$ 与 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_61$ 。可以注意到，这种情况与同协方差阵的直接判别法有很强的联系：同协方差阵情况下， $fisher判别分析r语言 fisher怎么判断rs_方差分析_62$ ，判别系数为 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_63$ ，与这里的特征向量恰好差了一个倍数。

接下来，就可以按照距离判别法对两个类进行判别，记样本 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_64$ 经过变换后变成 $fisher判别分析r语言 fisher怎么判断rs_线性变换_65$ 。投影后 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_08$ 的样本方差是 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_67$ ，判别阈值点可以取成
$fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_68$
这里两种阈值点分别对应转换后方差相等于不等的情况。设 $fisher判别分析r语言 fisher怎么判断rs_线性变换_69$ ，如果 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_70$ 大于阈值点，就判给 $fisher判别分析r语言 fisher怎么判断rs_fisher判别分析r语言_71$ ；否则判给 $fisher判别分析r语言 fisher怎么判断rs_方差分析_72$ 。

对于 $fisher判别分析r语言 fisher怎么判断rs_线性变换_73$ 的情况，如果只取一个最大的特征值对应的特征向量作为线性判别函数，则情况与上面的类似，不同之处，只是在于一维直线上聚集了多个不同的正态总体 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_08$ ，同样考察变换后的样本到变换后的类的马氏距离，取最小的即可，即：
$fisher判别分析r语言 fisher怎么判断rs_方差分析_75$
如果有 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_39$ 个非零特征根与相应的 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_39$ 个线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_方差分析_78$ ，将原来每个样本的 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_46$ 个变量变成 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_39$ 个新变量，这时候常常取 $fisher判别分析r语言 fisher怎么判断rs_线性变换_81$ ，且满足 $fisher判别分析r语言 fisher怎么判断rs_方差分析_82$ ，这样就把 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_46$ 元总体的判别问题化成了 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_58$ 元总体的判别问题，运用 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_58$ 元数据的距离判别法即可。

回顾总结

Fisher判别法的思想是，将原来距离较近的类通过某种线性判别函数的投影，分散到一个一维空间或者多维空间上，再用距离判别法来判别。
线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_方差分析_86$ 与其判别效率 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_87$ ，是 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_88$ 的最大特征值与对应的特征向量，这里 $fisher判别分析r语言 fisher怎么判断rs_线性变换_89$ 是组内离差阵， $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_90$ 是组间离差阵，即
$fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_91$
特别当只有两组的时候，有
$fisher判别分析r语言 fisher怎么判断rs_方差分析_92$
此时 $fisher判别分析r语言 fisher怎么判断rs_线性变换_93$ 经过变换变成 $fisher判别分析r语言 fisher怎么判断rs_方差分析_94$ ，分离的阈值点是
$fisher判别分析r语言 fisher怎么判断rs_方差分析_95$
如果只选择一个线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_方差分析_86$ ，那么就把数据映射到一维空间上，计算映射后样本到每个类的马氏距离，选择最小的那个：
$fisher判别分析r语言 fisher怎么判断rs_方差分析_97$
如果选了多个线性判别函数 $fisher判别分析r语言 fisher怎么判断rs_Fisher判别法_98$ ，一般需要满足 $fisher判别分析r语言 fisher怎么判断rs_多元统计分析_99$ ，将每一个 $fisher判别分析r语言 fisher怎么判断rs_线性变换_100$ 元样本 $fisher判别分析r语言 fisher怎么判断rs_线性变换_93$ 映射成 $fisher判别分析r语言 fisher怎么判断rs_方差分析_86$ 元样本 $fisher判别分析r语言 fisher怎么判断rs_方差分析_103$ ，再用 $fisher判别分析r语言 fisher怎么判断rs_方差分析_86$ 元总体的距离判别法进行判别。