典型相关分析
是研究两组变量之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在关系
在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系。然而,这些统计方法在研究两组变量之间的相关关系时却无能为力。比如要研究生理指标与训练指标的关系,居民生活环境与健康状况的关系,人口统计变量(户主年龄、家庭年收入、户主受教育程度)与消费变量(每年去餐馆就餐的频率、每年出外看电影的频率)之间是否具有相关关系?阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)是否相关?这些多变量间的相关性如何分析?
基本思想
基本思想和主成分分析非常相似。
首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,
如此继续下去,直到两组变量之间的相关性被提取完毕为此。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。
分析原理及方法
由于相关系数与量纲无关
因此相同相关系数会有很多个系数a,b,为了保证唯一性,故增加条件方差唯一
至此便求出第一对典型相关变量,可类似求出各对之间互不相关的第二对、第三对等典型相关变量
注意:我们可以通过检验各对典型相关变量相关系数的显著性来反映每一对综合变量的代表性,若某对相关程度不显著,该对变量就不具有代表性,就可以忽略该对变量
具体如下:
一通推导后,最后得出结果,λ对应A的特征根
我们要求Corr(U,V)最大值也就是求:
至此便求出了第一对典型变量,呢么如何来求第二典型相关变量?
第二对典型变量也需要满足方差为1的条件
而且还需满足条件即不再包含第一对典型变量已包含的信息
样本典型相关变量及典型相关系数的计算
由于实际分析应用中,总体协方差通常未知,往往需要根据样本估计总体协方差矩阵,并在此基础上进行典型相关分析
典型相关系数的显著性检验
首先进行两组变量的相关性检验(有关再继续进行后续的相关系数检验)
接下来对典型相关系数进行检验(这是一个递推的过程)
开始检验
实例:康复俱乐部
计算A矩阵,B矩阵
A,B两个矩阵特征值相同,计算他们的非零特征值(非零特征值的个数也就是矩阵的秩),开根号即为典型相关系数
特征值对应的特征向量即为典型相关变量线性组合的系数
开始进行典型相关系数显著性检验
(这里也可以用前面讲述过的单独的检验,检验变量有没有相关性)
故,调整一下显著性水平为0.1
继续检验
SPSS操作
典型变量每个分量前的系数代表着重要程度,可结合典型相关系数进行分析。