进行相关分析

双变量相关 计算变量之间

皮尔逊相关系数(直接解读) 
肯德尔(需要计算偏相关性)
斯皮尔曼(需要通过`*`与`**`的大小进行判断)

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_人工智能

一. 分析花瓣长、花枝长与花萼长两两相关性关系

采用皮尔逊 双尾检验

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_概率论_02

显著性检验
 双尾(双侧检验) 以0.01为检验标准
 单尾(单侧检验) 以0.05为检验标准

数据为对称矩阵(对角线为1)

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_03

上图的Sig.(双尾) 与 花枝长的系数为0.00 < 0.01 => 有相关性 系数有效

二. 分析地位域、权威主义与顺从性两两相关性关系

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_人工智能_04

数据分析

采用肯德尔 斯皮尔曼 双尾检验

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_05

肯德尔计算三个数之间哪两个相关性更大 可以使用 偏相关系数

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_06

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_07=地位欲 python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_08=权威主义 python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_09=顺从性

代入计算得 Rpython 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_10=0.62 => 即偏相关系数更接近与Y => python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_07python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_08的相关性与python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_09无关

斯皮尔曼的相关系数一行可以看出在那一级别(双尾)下 相关性更强

0.818 > 0.615 => 地位欲在0.01级别时相关性更为显著

观察数值处于正负1附近时数值相关性更大

距离相关 计算记录(样本)之间

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_14

三.分析国家之间在森林面积、森林覆盖率、林木蓄积量与草原面积之间的相关性

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_聚类_15

分析数据 进行聚类分析

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_16

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_17

系统聚类

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_18

通过系统聚类将上述国家进行动态聚类

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_19

可以看出使用平方欧式距离来进行聚类 将7与15记录聚在一起

下一阶段是阶段6 再将记录4聚在一起

垂直冰柱图(直观动态归类过程)

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_概率论_20

可以看到垂直冰柱图的最低是 7与15 之间的柱子 再是 11与16 之间的柱子 再是 4与14 之间的柱子 再是 14与12 之间(即4与14与12 归为一类) 以此类推

可以自定义聚类统计等

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_人工智能_21

可以看到分类变为自定义的个数

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_22

也可以在生成结果中添加图

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_聚类_23

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_人工智能_24

数据转置

常用于将以行为数据参数的记录 转置为列排

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_人工智能_25

K-均值聚类

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_概率论_26

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据分析_27

数据分析

python 基于斯皮尔曼 删除高相关性变量 spss斯皮尔曼相关_数据_28