ML之Spearman:Spearman相关系数(斯皮尔曼等级相关系数)的简介、案例应用之详细攻略

目录

​Spearman相关系数(斯皮尔曼等级相关系数)的简介​

​(1)、Spearman相关系数(斯皮尔曼等级相关系数)的计算逻辑​

​Spearman相关系数(斯皮尔曼等级相关系数)的的案例应用​


Spearman相关系数(斯皮尔曼等级相关系数)的简介

        在 ​​统计学​​中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。 它是衡量两个​​变量​​​的​​依赖性​​​的 非参数 指标。 它利用​​单调​​方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。

        Spearman秩相关系数是一个非参数性质(与分布无关)的秩统计参数,由Spearman在1904年提出,用来度量两个变量之间联系的强弱(Lehmann and D'Abrera 1998)。Spearman秩相关系数可以用于R检验,同样可以在数据的分布使得Pearson线性相关系数不能用来描述或是用来描述或导致错误的结论时,作为变量之间单调联系强弱的度量。

        在统计学中,Spearman秩相关系数或称为Spearman的ρ,是由Charles Spearman命名的,一般用希腊字母ρs(rho)或是rs表示。Spearman秩相关系数是一个非参数的度量两个变量之间的统计相关性的指标,用来评估当用单调函数来描述是两个变量之间的关系有多好。在没有重复的数据的情况下,如果一个变量是两外一个变量的严格单调的函数,则二者之间的Spearman秩相关系数就是+1或-1,称变量完全Spearman相关。

(1)、Spearman相关系数(斯皮尔曼等级相关系数)的计算逻辑

        Spearman秩相关系数通常被认为是排列后的变量之间的Pearson线性相关系数,在实际计算中,有更简单的计算ρs的方法。假设原始的数据xi,yi已经按从大到小的顺序排列,记x’i,y’i为原xi,yi在排列后数据所在的位置,则x’i,y’i称为变量x’i,y’i的秩次,则di=x’i-y’i为xi,yi的秩次之差。

        斯皮尔曼相关系数被定义成等级变量之间的​​皮尔逊相关系数​​。对于样本容量为n的样本,n个原始数据被转换成等级数据,相关系数ρ为

ML之Spearman:Spearman相关系数(斯皮尔曼等级相关系数)的简介、案例应用之详细攻略_原始数据

         原始数据依据其在总体数据中平均的降序位置,被分配了一个相应的等级。如下表所示


变量Xi



降序位置



等级xi



0.8



5



5



1.2



4



1.2



3



2.3



2



2



18



1



1


         实际应用中,变量间的连结是无关紧要的,于是可以通过简单的步骤计算ρ.被观测的两个变量的等级的差值,则ρ为

ML之Spearman:Spearman相关系数(斯皮尔曼等级相关系数)的简介、案例应用之详细攻略_计算逻辑_02

Spearman相关系数(斯皮尔曼等级相关系数)的的案例应用

相关文章:ML之PCC:PCC皮尔逊相关系数(Pearson correlation coefficient)的简介、案例应用(与spearman相关系数对比及其代码实现)之详细攻略