线性判别分析要解决的问题
为什么要做降维?
1.数据维度(特征)很大,数据量很大。需要的计算量也大。调参,评估都需要大量的计算,这些都会导致效率低下。
2.并非所有的特征都有用处。对于不重要的特征应该剔除,只保留最好的特征。
降维可以减少计算量,提高速度。减少建模使用的特征数。
PCA另一种常使用的降维方法。
分类任务,有监督的。
投影,是重点要做的。
提取出最能够帮助分类的特征。在这些特征子空间做分类。这就是LDA主要要去做的事。
神奇!
线性判别分析要优化的目标
类别之间的距离
类别之内的距离
总的来说
线性判别分析求解
Sw 和SB 知道了,w就可求解了,也就是知道往哪个方向投影了。