文章目录

  • 相关性分析函数
  • 1. 计算协方差:cov()
  • 2. 计算相关性系数:cor()
  • 3. 计算偏相关系数:ggm包中的pcor()
  • 相关性检验函数
  • 1. 相关性的检验:cor.test()
  • 2. 递归相关性的检验:corr.test()
  • 3. 偏相关系数的检验:ggm包中的pcor.test()


协方差 ——英文: covariance
相关性系数 ——英文:Correlation coefficient
必须要看懂下面这个博客:
详细见:5. 统计学基础2:协方差、相关系数、协方差矩阵

相关性分析:是指对两个或者多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度
相关性元素之间,需要存在一定的联系才可以进行相关性分析,简单来说就是变量之间是否有关系(也就是说需要先进行独立检测之后才能进行相关分析)。

相关系数的大小表示相关性的大小,相关系数包括:
pearson相关系数、spearman相关系数、kendall相关系数、偏相关系数、多分格相关系数和多系列相关系数

相关性分析函数

1. 计算协方差:cov()

cov()函数可以用来计算协方差,可以用来衡量两个变量的整体误差

R语言cor函数报错dimension r语言cor函数的用法_协方差



2. 计算相关性系数:cor()

与独立性检验不同,相关性分析中每种方法都没有独立的函数,这里计算相关性系数都使用同一个函数:cor()函数。

常用:cov(x, y = NULL, use = "", method = "")

x:数字矢量、矩阵或数据帧。
y:NULL(默认值)或具有与x兼容维度的向量、矩阵或数据帧。默认值相当于y=x(但更有效)。

na.rm:是否应删除缺失的值?
use:一个可选字符串,给出了在缺少值的情况下计算协方差的方法。
这必须是字符串“everything”、“all.obs”、“complete.obs”、“na.or.complete”或“pairwise.complete.ob”之一的缩写。

method:指示要计算哪个相关系数(或协方差)的字符串。“pearson”(默认)、“kendall”或“spearman”之一,可以缩写。

V:对称数字矩阵,通常是正定的,如协方差矩阵。

此处我们使用state.x77数据作为实例数据(这是一个矩阵数据):

R语言cor函数报错dimension r语言cor函数的用法_数据_02


设相关系数为η, η 的取值范围为 [ − 1 , 1 ]

当 η 为正值时,X、Y 正相关,值越大正相关性越强;

当 η 为负值时,X 、Y负相关,值越小负相关性越强

当 η 趋于 0 时,基本不相关。当 η = 0 时, X、Y 不相关

cor()函数只能计算三种相关系数,其他相关系数的计算可以通过R的拓展包



3. 计算偏相关系数:ggm包中的pcor()

偏相关系数:是指在控制一个或者多个变量时,剩余其他变量之间的相互关系

pcor()函数需要输入两个重要的参数:
1️⃣第一个参数是一个数值向量(前两个数值表示要计算相关系数的下标,其余的数值为条件变量的下标
2️⃣第二个参数是cov( )函数计算出来的协方差结果

比如此处我们想控制收入水平、文盲率和高中毕业率的影响,看人口(第一列)和谋杀率(第五列)之间的关系(先获取列名,不然容易混):

R语言cor函数报错dimension r语言cor函数的用法_开发语言_03



相关性检验函数

1. 相关性的检验:cor.test()

在进行相关性分析之后,对相关性进行检验,cor.test()函数可用于相关性的检验。该函数有四个比较重要的选项参数,

cor.test(x, y,
         alternative = c("two.sided", "less", "greater"),
         method = c("pearson", "kendall", "spearman"),
         exact = NULL, conf.level = 0.95, continuity = FALSE, ...)

1. 其中x和y是需要检测的相关性变量

2. alternative是用来指定进行双侧检验还是单侧检验
two.sided代表分别检测正负相关性,greater代表正相关,less代表负相关。

3.Method选项用于指定用哪种相关系数,可选的有pearson相关系数、spearman相关系数、kendall相关系数。

我们使用state.x77数据检测一下谋杀率与文盲率之间的关系

R语言cor函数报错dimension r语言cor函数的用法_r语言_04

Cor.test()只能一次性检测一组变量的关系



2. 递归相关性的检验:corr.test()

psych包中的corr.test()函数,可以一次性进行多个变量的检验,这个函数还可以进行递归操作

> library(psych)

R语言cor函数报错dimension r语言cor函数的用法_协方差_05


图片下面绿色的是cor.test()计算出来的p-value值



3. 偏相关系数的检验:ggm包中的pcor.test()

使用ggm包中的pcor.test()函数,要先用pcor( )计算偏相关系数

> pcor(c(1,5,2,3,6),cov(state.x77))
[1] 0.3462724

再用pcor.test() 对其进行检验

R语言cor函数报错dimension r语言cor函数的用法_r语言_06

返回三个值,分别是t检验,自由度和p-value值