文章目录
- 十五、Fisher判别法
- 1.Fisher判别法概述
- 2.如何寻找线性函数
- 3.Fisher判别准则
- 回顾总结
十五、Fisher判别法
1.Fisher判别法概述
在直接判别法中,如果我们假象每个类在占据一个空间,那么我们判别样本属于其中的某一类,就以马氏距离(或广义马氏距离)作为标准,换言之,我们可以想象成每一个具有某种“吸引力”,将距离它比较近的样本“拉”过来,这种拉力将分成个互不相交的区域。如果每个类占据的空间比较近,它们的“拉力界限”会比较模糊,判别的结果就会比较差。
如果存在某种变换,能将不同的类占据的空间分散开来,对样本也施加这种变换后,判别就发生在变换后的空间上,变成界限清晰的判别,这就是Fisher判别的基本思想。由于线性函数在实际应用中最方便,所以我们会使用一个线性函数进行投影。
我们可以将Fisher判别法视为距离判别法的补充,因为我们之前说过,距离判别对于均值相近的总体效果较差;如果使用投影函数,将原来的总体映射到一个均值能被拉开的一元空间或多元空间上,就能提高分辨的效率。
2.如何寻找线性函数
要鉴别是否将不同的类分开,可以运用方差分析的方法,即对比组内平方和与组间平方和的差距。现假设从中抽取的总体是,则组内离差阵和组间离差阵是
经过线性变换的处理后,离差阵变成平方和,即
所以,根据方差分析的思想(参见《十一、回归方程与回归系数的显著性检验》:1.平方和分解),如果分组足够开,组间平方和与组内平方和的商应该会比较大,即定义
要求的结果是,为了对作出限制,增添一个条件,这样问题就变成了
这是一个带约束求最值问题,使用Lagrange乘数法,得到Lagrange函数是
由此,是的特征根,是相应的特征向量,且,也就是说的最大化问题,实际上是求的最大特征值和相应特征向量的问题。所以,我们最终结论是:
Fisher线性判别结论:在Fisher准则下,线性判别函数的解,是特征方程的最大特征根所对应的特征向量,满足,且相应的判别效率为
如果一个线性判别函数不能很好区分个总体,就选择第二大的特征值对应的特征向量,以此类推到第三个、第四个……称线性判别函数的累计判别能力为
这里是非零特征值总数,。
3.Fisher判别准则
如果的非零特征值是,对应的特征向量是。这里,则我们可以建立线性投影函数,将元数据投影到一维直线上,但此时又应该如何判别?
先考虑的时候,此时,线性判别函数只有一个:,现在要求出特征根与特征向量。接下来是特征值求值的推导:
由于与的特征值相同,所以的特征值与相同,即
这里,是组内离差阵。与之对应的特征向量为
它满足与。可以注意到,这种情况与同协方差阵的直接判别法有很强的联系:同协方差阵情况下,,判别系数为,与这里的特征向量恰好差了一个倍数。
接下来,就可以按照距离判别法对两个类进行判别,记样本经过变换后变成。投影后的样本方差是,判别阈值点可以取成
这里两种阈值点分别对应转换后方差相等于不等的情况。设,如果大于阈值点,就判给;否则判给。
对于的情况,如果只取一个最大的特征值对应的特征向量作为线性判别函数,则情况与上面的类似,不同之处,只是在于一维直线上聚集了多个不同的正态总体,同样考察变换后的样本到变换后的类的马氏距离,取最小的即可,即:
如果有个非零特征根与相应的个线性判别函数,将原来每个样本的个变量变成个新变量,这时候常常取,且满足,这样就把元总体的判别问题化成了元总体的判别问题,运用元数据的距离判别法即可。
回顾总结
- Fisher判别法的思想是,将原来距离较近的类通过某种线性判别函数的投影,分散到一个一维空间或者多维空间上,再用距离判别法来判别。
- 线性判别函数与其判别效率,是的最大特征值与对应的特征向量,这里是组内离差阵,是组间离差阵,即
- 特别当只有两组的时候,有
此时经过变换变成,分离的阈值点是 - 如果只选择一个线性判别函数,那么就把数据映射到一维空间上,计算映射后样本到每个类的马氏距离,选择最小的那个:
- 如果选了多个线性判别函数,一般需要满足,将每一个元样本映射成元样本,再用元总体的距离判别法进行判别。