原理

GWAS 的主要方法学依据是归纳法中的共变法,是探究复杂因果关系最主要的科学思维和方法。所谓共变法,是通过考察被研究现象发生变化的若干场合中,确定是否只有一个情况发生相应变化,如果是,那么这个发生了相应变化的情况与被研究现象之间存在因果联系。GWAS是利用连锁不平衡(Linkage Disequilibrium,LD)的原理来识别分子标记(SNP、InDel、CNV)与目标性状之间相关性的分析方法。

需要理解什么是连锁不平衡。
GWAS初探_微信公众号

连锁平衡:不同基因座上的等位基因随机组合,不同基因座的等位基因组合的频率(PAB)等于该组合中等位基因各自频率的乘积(PA×PB),不存在优势组合。
连锁不平衡:不同座位上两个等位基因实际出现的频率(P’AB)与预期的随机频率(PAB)之间存在明显差异,即P’AB =PAB+D。D值越大,连锁不平衡程度越大,连锁越紧密。因此,连锁不平衡又称等位基因关联(allelic association)。

如果还不理解,试着看看这段解释:
基因A与基因B位于同一条染色体上,在减数分裂时进入同一子细胞,通俗的说就是:“基因A与基因B总是在一起”,这种现象就称为连锁。
如果在减数分裂的联会时期,同源染色体非姐妹染色单体发生了交叉互换,使得产生的子细胞中不完全是“基因A与基因B在一起”,还有“基因A与基因b在一起”,这种现象称为不完全连锁,即连锁不平衡。
详细可参考:​​​连锁不平衡:linkage disequilibrium​

流程

GWAS初探_javascript_02

更多分析内容可参考:
​​​全基因组关联分析(GWAS)-基本分析内容​​​​GWAS进阶备选学习资料(GWAS tutorial)​

作者:Bioinfarmer,若要及时了解动态信息,请关注同名微信公众号:Bioinfarmer。