CT科研是CT技术的窗口,帮助医务工作者开展CT科研也是我们的责任和义务!
问
碘密度准确性的研究进展如何呀?
答
数据都收集到Excel了,
选什么统计方法来对比呢?
CT科研7 相关系数在对比研究中的应用
目录
⊙1.相关系数的分类
⊙2.相关类型及散点图
⊙3.相关系数的性质
⊙4.相关系数的计算
⊙5.相关系数的统计学检验
1.相关系数的分类
在昨天介绍SPSS(Statistical Package for the Social Science,社会科学统计软件包)时引用了一篇文献,如下图[1],这篇研究在对比两种CT技术的碘定量准确性时用到了相关系数。
通过两种CT技术各自的测量值与真实值的线性相关系数来对比二者的准确性,如下图。
以上用到的是皮尔逊(pearson)相关系数,那么除了皮尔逊系数以外,还有什么相关系数呢?
统计学上的双变量相关性有三种相关系数,分别为pearson(皮尔逊), kendall(肯德尔) 和spearman(斯皮尔曼),如下图。
Pearson系数:积差相关, 计算连续变量或是等间距测度的变量间的相关分析。
Kendall系数:等级相关,计算分类变量间的秩相关,适用于合并等级资料。
Spearman系数:等级相关,适用于连续等级资料。
接下来,我们重点讨论Pearson系数。
2.相关类型及散点图
为了确定相关变量之间的关系,首先应该收集一些数据,并且这些数据应该是成对的。然后在直角坐标系上描述这些点,这一组点集称为散点图,如下图。
然后通过这样的散点图,可以把两种变量直接的相关类型分为三种:正相关、负相关、零相关。
通过相关散点图的形状,我们可以大概判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。
为了精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数(r)。
3.相关系数的性质
相关系数的取值范围为:-1< r <1
|r|表明两变量间相关的程度,绝对值越大相关性越强。
r>0表示正相关,
r<0表示负相关,
r=0表示零相关,如下图。
|r|越接近于1,表明两变量相关程度越高,它们之间的关系越密切,反之亦然,如下图。
4.相关系数的计算
Pearson系数,也叫积差相关系数,计算公式非常复杂,如下图。
在引用文献中,相关系数r都是通过SPSS直接获得的。
通过小编测试发现,在SPSS输出列表中,如下图,Y轴参数(测量值)下方所列分别为相关系数r和显著性检验的P值(红框内)。
5.相关系数的统计学检验
为什么在上图中,SPSS给出相关系数r的同时,还要给出P值呢?
因为以上相关系数(r=0.829)只是9对数字计算所得的相关系数,那么这组样本跟总体相关系数(或真实的相关系数)到底是否存在差异呢?
这个问题必须通过对相关系数r的统计学检验才能回答,
检验的方法就是假设真实的相关系数为0(完全不相关),那么在“实际”不相干的两个变量中随机抽样,获得9对数据得到的相关系数应该有95%以上的概率为0,这个概率不可能为100%,那么就有一定概率抽到相关系数不为0的9对数据,但是这个概率应该很小,一般小于5%。P值检验就是来确定这个小概率事件的发生概率是否足够小,如果足够小,那么就认为所得的相关系数是真实的,如果不够小(p>0.05),那么就认为所得相关系数检验不通过,不是真实的。 上图中p值为0.006,足够小,因此r=0.829是真实的。