典型相关分析

是研究两组变量之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在关系

在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量线性相关关系。然而,这些统计方法在研究两组变量之间的相关关系时却无能为力。比如要研究生理指标与训练指标的关系,居民生活环境与健康状况的关系,人口统计变量(户主年龄、家庭年收入、户主受教育程度)与消费变量(每年去餐馆就餐的频率、每年出外看电影的频率)之间是否具有相关关系?阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)是否相关?这些多变量间的相关性如何分析?

基本思想
基本思想和主成分分析非常相似。
首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,
如此继续下去,直到两组变量之间的相关性被提取完毕为此。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。

分析原理及方法

python进行多变量相关性分析 多变量间的相关性分析_概率论


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_02


由于相关系数与量纲无关

python进行多变量相关性分析 多变量间的相关性分析_相关分析_03


因此相同相关系数会有很多个系数a,b,为了保证唯一性,故增加条件方差唯一

python进行多变量相关性分析 多变量间的相关性分析_方差_04


至此便求出第一对典型相关变量,可类似求出各对之间互不相关的第二对、第三对等典型相关变量

注意:我们可以通过检验各对典型相关变量相关系数的显著性来反映每一对综合变量的代表性,若某对相关程度不显著,该对变量就不具有代表性,就可以忽略该对变量

具体如下:

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_05


python进行多变量相关性分析 多变量间的相关性分析_概率论_06


python进行多变量相关性分析 多变量间的相关性分析_特征值_07


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_08


python进行多变量相关性分析 多变量间的相关性分析_概率论_09


python进行多变量相关性分析 多变量间的相关性分析_相关分析_10


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_11


一通推导后,最后得出结果,λ对应A的特征根

python进行多变量相关性分析 多变量间的相关性分析_方差_12


我们要求Corr(U,V)最大值也就是求:

python进行多变量相关性分析 多变量间的相关性分析_特征值_13


python进行多变量相关性分析 多变量间的相关性分析_概率论_14


python进行多变量相关性分析 多变量间的相关性分析_特征值_15

至此便求出了第一对典型变量,呢么如何来求第二典型相关变量?

第二对典型变量也需要满足方差为1的条件

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_16


而且还需满足条件即不再包含第一对典型变量已包含的信息

python进行多变量相关性分析 多变量间的相关性分析_概率论_17


python进行多变量相关性分析 多变量间的相关性分析_特征值_18


python进行多变量相关性分析 多变量间的相关性分析_特征值_19


样本典型相关变量及典型相关系数的计算

由于实际分析应用中,总体协方差通常未知,往往需要根据样本估计总体协方差矩阵,并在此基础上进行典型相关分析

python进行多变量相关性分析 多变量间的相关性分析_相关分析_20


python进行多变量相关性分析 多变量间的相关性分析_特征值_21


python进行多变量相关性分析 多变量间的相关性分析_概率论_22


python进行多变量相关性分析 多变量间的相关性分析_相关分析_23


python进行多变量相关性分析 多变量间的相关性分析_概率论_24


python进行多变量相关性分析 多变量间的相关性分析_方差_25


典型相关系数的显著性检验

首先进行两组变量的相关性检验(有关再继续进行后续的相关系数检验)

python进行多变量相关性分析 多变量间的相关性分析_方差_26


python进行多变量相关性分析 多变量间的相关性分析_相关分析_27


接下来对典型相关系数进行检验(这是一个递推的过程)

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_28


python进行多变量相关性分析 多变量间的相关性分析_概率论_29


开始检验

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_30


python进行多变量相关性分析 多变量间的相关性分析_方差_31


python进行多变量相关性分析 多变量间的相关性分析_概率论_32


实例:康复俱乐部

python进行多变量相关性分析 多变量间的相关性分析_相关分析_33


计算A矩阵,B矩阵

python进行多变量相关性分析 多变量间的相关性分析_方差_34


A,B两个矩阵特征值相同,计算他们的非零特征值(非零特征值的个数也就是矩阵的秩),开根号即为典型相关系数

python进行多变量相关性分析 多变量间的相关性分析_概率论_35


特征值对应的特征向量即为典型相关变量线性组合的系数

python进行多变量相关性分析 多变量间的相关性分析_概率论_36

开始进行典型相关系数显著性检验

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_37


python进行多变量相关性分析 多变量间的相关性分析_相关分析_38


python进行多变量相关性分析 多变量间的相关性分析_特征值_39


(这里也可以用前面讲述过的单独的检验,检验变量有没有相关性)

故,调整一下显著性水平为0.1

python进行多变量相关性分析 多变量间的相关性分析_相关分析_40


继续检验

python进行多变量相关性分析 多变量间的相关性分析_特征值_41


python进行多变量相关性分析 多变量间的相关性分析_方差_42


SPSS操作

python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_43


python进行多变量相关性分析 多变量间的相关性分析_特征值_44


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_45


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_46


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_47


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_48


python进行多变量相关性分析 多变量间的相关性分析_方差_49


python进行多变量相关性分析 多变量间的相关性分析_python进行多变量相关性分析_50


python进行多变量相关性分析 多变量间的相关性分析_方差_51


典型变量每个分量前的系数代表着重要程度,可结合典型相关系数进行分析。