分享一篇最近发表在NC的一篇文章:CoPheScan: phenome-wide association studies accounting for linkage disequilibrium。文章介绍了一种新的贝叶斯方法CoPheScan(Coloc adapted Phenome-wide Scan),用于在考虑连锁不平衡(LD)的情况下进行表型范围关联研究(Phenome-wide association studies, PheWAS)。CoPheScan通过模拟研究展示了其在控制假阳性率方面相比传统方法的优势,并在真实数据集上的应用中展示了其性能。

Nature Comm. | CoPheScan:一种考虑连锁不平衡的全表型组关联分析_ide

研究背景

PheWAS允许研究者探索单个遗传变异与多种表型之间的关联,这对于药物再利用和发现潜在的不良效应具有重要意义。然而,PheWAS受限于无法区分由于LD产生的混杂与真正的多效性。CoPheScan旨在解决这一问题,通过同时处理LD混杂和探索因果关联。

方法

CoPheScan基于coloc方法的改编,用于在已知某个变异对某个表型有因果影响的情况下,对其进行表型范围扫描以测试与其他表型/性状的因果关联。该方法考虑了两个性状在基因组区域内的遗传关联模式,并评估它们是否可能在该区域内共享一个因果变异。CoPheScan可以利用外部协变量数据,如表型之间的遗传相关性,并根据不同的LD信息可用性和分析者是否愿意对测试基因组区域内的因果变异数量做出假设,以不同的方式运行。

Nature Comm. | CoPheScan:一种考虑连锁不平衡的全表型组关联分析_ci_02

模拟研究

作者通过模拟研究展示了CoPheScan的性能。模拟数据包括具有零个、一个或两个因果变异的性状,以对应CoPheScan的三种假设。研究发现,CoPheScan在控制假阳性率方面表现优于传统方法,尽管在存在多个因果变异时敏感性略有下降。

真实数据应用

研究者使用CoPheScan对来自FinnGen疾病端点的136个疾病因果变异、527个血浆蛋白的505个pQTL变异以及3586个蛋白质截断变异(PTV)进行了PheWAS。在2275个英国生物银行(UK Biobank)的疾病表型中,CoPheScan识别了已知多效性基因如APOE的复杂性,并为TGM3在皮肤癌中的新因果角色提供了证据。

结果

CoPheScan在模拟数据上的表现显示,与传统方法相比,它在控制假阳性率方面有显著优势。在真实数据集上,CoPheScan能够识别与已知疾病相关的遗传变异,并揭示了新的可能的因果关联,例如TGM3与皮肤癌的关联。

讨论

CoPheScan通过考虑查询变异集合中的信息,不仅关注给定变异的小p值,还关注与其邻居相比的小p值,并估计由于信息而应向上加权的程度。CoPheScan的一个优势是能够利用SuSIE检测位点上的等位基因异质性。然而,CoPheScan也有其局限性,例如对LD信息的依赖,以及目前仅适用于单祖先研究。

数据和代码

Nature Comm. | CoPheScan:一种考虑连锁不平衡的全表型组关联分析_ide_03

作者:生物信息与育种,请关注同名微信公众号:生物信息与育种。