FDR校正的程序实现及严格程度对比

 

前言

 

        做统计分析就离不开P value<0.05,而写过科研文章的人也都知道没有经过FDR校正的P值就像一盘散沙,不用风吹,走两步自个儿就散了。 那么FDR校正这个让人又爱又恨的东西是什么呢?又是如何实现呢?

http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html

        没听明白?再说简单点就是对统计分析结果产生的P值做一次筛选,对原始P值<0.05这个显著性的真实性用FDR校正后的新P值做判定。

         下面对FDR校正的程序实现基于MATLAB和R分别进行介绍。

 

(一) MATLAB实现

 

mafdr函数

 

1. FDR = mafdr(PValues);                                                        

%最简单的实现方式,基于Storey procedure ( introduced by Storey, 2002),适用于P值数量>1000的情况,否则原则上会崩溃。我用MATLAB测试过,会出现warning,但不会报错。严格程度较低,如果你的 ttest P值不是特别显著(0.01-0.05),可以用这个试试,或许可以过FDR校正.

 

2.FDR=mafdr(P,'BHFDR', true);                                              

%基于linear step-up (LSU) procedure (introduced by Benjamini and Hochberg, 1995)。最常见的FDR校正方式,严格程度较高,但比
Bonferroni校正低,适用于 ttest P值显著(<0.01)。

注:

BHFDR的计算过程

1. 将一系列的p值按照从大到小排序,然后利用下述公式计算每个p值所对应的FDR值:

公式:FDR = p * (n/i), p是pvalue,n是p值个数,最大的P值的i值为n,第二大则是n-1,依次至最小为1。

2. 将计算出来的FDR值作为新p值,如果某一个p值所对应的FDR值大于前一位p值(更大的p值)所对应的FDR值,则放弃公式计算出来的FDR值,选用与它前一位相同的值,因此会产生连续相同FDR值的现象;反之则保留计算的FDR值。

3. 返回p值对应的FDR值。

 

3.FDR=mafdr(P,'Lambda', [0.01:0.01:0.95]);                          

 %指定调整参数λ,用于估计零假设为真的先验概率,Lambda Value可以是:(1)0-1内任意一值  (2)4个以上序列,或以示例的矩阵形式:[first:incr:last],mafdr函数自动选择最优参数。严格程度比1略低,我用第一个不能过校正但是用这个居然可以过,为FDR苦恼得同志们可以被解救了。

 

4.FDR= mafdr(P, 'Method', MethodValue, [0.01:0.01:0.95]);   

%对选择最优参数lambda的方法进行选择,'bootstrap' (default),'polynomial'。第3种方法的延伸。

 

(二) R语言实现

 

p<-c(p1,p2,...,pn)                                                                    %括号内载入P值序列,","间隔

p.adjust(p,method="method value",length(p))                    %通过修改method value变换FDR方法,包括"holm","horchberg","hommel","bonferroni","BH","BY","fdr"。从严格程度上"bonferroni"最可怕,"BH","fdr"与MATLAB的1,2相同,其余在之间。

 

FDR校正的程序实现先说到这里,如果你有其他的方法请在下方留言评论或发邮件与我交流,我的邮箱是liuyuchen0020@163.com