CT科研是CT技术的窗口,帮助医务工作者开展CT科研也是我们的责任和义务!     

碘密度准确性的研究进展如何呀?

数据都收集到Excel了,

选什么统计方法来对比呢?

CT科研7   相关系数在对比研究中的应用

目录


⊙1.相关系数的分类

⊙2.相关类型及散点图

⊙3.相关系数的性质

4.相关系数的计算

⊙5.相关系数的统计学检验

1.相关系数的分类

在昨天介绍SPSS(Statistical Package for the Social Science,社会科学统计软件包)时引用了一篇文献,如下图[1],这篇研究在对比两种CT技术的碘定量准确性时用到了相关系数。

r语言pearson相关系数图 r语言中相关系数_ci

通过两种CT技术各自的测量值与真实值的线性相关系数来对比二者的准确性,如下图。

r语言pearson相关系数图 r语言中相关系数_数据_02

以上用到的是皮尔逊(pearson)相关系数,那么除了皮尔逊系数以外,还有什么相关系数呢?

统计学上的双变量相关性有三种相关系数,分别为pearson(皮尔逊), kendall(肯德尔) 和spearman(斯皮尔曼),如下图。

r语言pearson相关系数图 r语言中相关系数_ci_03

Pearson系数:积差相关, 计算连续变量或是等间距测度的变量间的相关分析。

Kendall系数:等级相关,计算分类变量间的秩相关,适用于合并等级资料。

Spearman系数:等级相关,适用于连续等级资料。

接下来,我们重点讨论Pearson系数。

2.相关类型及散点图

为了确定相关变量之间的关系,首先应该收集一些数据,并且这些数据应该是成对的。然后在直角坐标系上描述这些点,这一组点集称为散点图,如下图。

r语言pearson相关系数图 r语言中相关系数_数据_04

然后通过这样的散点图,可以把两种变量直接的相关类型分为三种:正相关、负相关、零相关。

通过相关散点图的形状,我们可以大概判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。

为了精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数(r)。

3.相关系数的性质

相关系数的取值范围为:-1< r <1

|r|表明两变量间相关的程度,绝对值越大相关性越强。

r>0表示正相关,

r<0表示负相关,

r=0表示零相关,如下图。

r语言pearson相关系数图 r语言中相关系数_ci_05

|r|越接近于1,表明两变量相关程度越高,它们之间的关系越密切,反之亦然,如下图。

r语言pearson相关系数图 r语言中相关系数_ci_06

4.相关系数的计算

Pearson系数,也叫积差相关系数,计算公式非常复杂,如下图。

r语言pearson相关系数图 r语言中相关系数_数据_07

在引用文献中,相关系数r都是通过SPSS直接获得的。

r语言pearson相关系数图 r语言中相关系数_r语言kendall协和系数_08

通过小编测试发现,在SPSS输出列表中,如下图,Y轴参数(测量值)下方所列分别为相关系数r和显著性检验的P值(红框内)。

r语言pearson相关系数图 r语言中相关系数_SPSS_09

5.相关系数的统计学检验

 为什么在上图中,SPSS给出相关系数r的同时,还要给出P值呢?

因为以上相关系数(r=0.829)只是9对数字计算所得的相关系数,那么这组样本跟总体相关系数(或真实的相关系数)到底是否存在差异呢?

这个问题必须通过对相关系数r的统计学检验才能回答,

检验的方法就是假设真实的相关系数为0(完全不相关),那么在“实际”不相干的两个变量中随机抽样,获得9对数据得到的相关系数应该有95%以上的概率为0,这个概率不可能为100%,那么就有一定概率抽到相关系数不为0的9对数据,但是这个概率应该很小,一般小于5%。P值检验就是来确定这个小概率事件的发生概率是否足够小,如果足够小,那么就认为所得的相关系数是真实的,如果不够小(p>0.05),那么就认为所得相关系数检验不通过,不是真实的。 上图中p值为0.006,足够小,因此r=0.829是真实的。