因子分析主要将所有原始变量分组,在一个组内变量的相关性较高,不同组间的变量相关性很低。从每个组提取一个公共因子代表这个组表示的信息,(公共因子相当于将组内各变量所代表的信息进行了整合)。因子分析可用于研究变量之间的相关关系(R型因子分析)和样品之间的相关关系(Q型因子分析)。
原始变量可以分解为几个公共因子的线性函数和与公共因子独立的特殊因子。
- 数据进行标准化(均值为0,方差为1)
- 公共因子F矩阵,E(F)=0,cov(F)=I,且各分量相互独立
- 特殊因子ε矩阵,E(ε)=0,cov(ε)=I
因子模型:X=AF+ε X为样本 ,A因子载荷矩阵
- 因子载荷aij的统计意义:,表示Xi,Fj之间的协方差和相关系数,因此aij绝对值越大,Xi,Fj之间相关性越大
- 变量共同度与剩余方差
的变量共同度为
为剩余方差,越大,对公共因子的依赖越大,因子分析越好
3.公共因子的方差贡献
用来反映公共因子对X的贡献,或对X的影响和作用。将所有方差贡献排序,可选出最具影响的公共因子
变量共同度其实就是矩阵A行相加,方差贡献就是矩阵的列相加
因子分析步骤:1.因子载荷的求解 2.因子旋转 3.计算因子
因子载荷的求解:
- 主成分法:先对数据进行主成分分析,把前几个主成分作为未旋转的公共因子。
缺点:得出的特殊因子之间不相互独立
2.主轴因子法
3.极大似然法:使用前提为公共因子和特殊因子服从正态分布
因子旋转:对初始公共因子进行线性组合,为了找到更好的公共因子
- 正交旋转:载荷矩阵A右乘一正交阵得到,得出的公共因子依然相互独立
- 斜交旋转:放弃了因子之间相互独立这个限制
旋转结果:使新的因子载荷系数要么尽可能地接近于0,要么尽可能的远离0.
因子得分:
将公共因子作为因变量,原始变量为自变量建立回归方程
F=BX
R为原始变量的相关矩阵
因子得分主要是为了对于已经建立的因子模型应用,考察样品的性质及样品之间的相互关系。