大家好,我是邓飞,之前推荐过这本《Genome-Wide Association Studies》的书籍,2022年出版的,内容比较前沿。

这几天看过一遍了,觉得干货很多,有很多知识点的连通,弄懂了之前是是而非的概念,收获很大。我觉得阅读一本书,如果把刚读懂的输出写篇文章,或者把没有搞懂的内容写出来交流一下,是掌握知识的快捷方法。所以,我计划,把每一章节搞成一篇文章。主要内容,不是单纯的翻译,而是拆解之后的再学习。

这本书的目录:

《Genome-Wide Association Studies》第一章:GWAS分析的主要步骤和关键要点_线性回归

今天介绍第一章:《GWAS分析的主要步骤和关键要点》。

GWAS分析大体有四个部分:

  • 1,表型数据分析
  • 2,基因型数据分析
  • 3,关联分析
  • 4,候选基因分析

《Genome-Wide Association Studies》第一章:GWAS分析的主要步骤和关键要点_线性回归_02

GWAS VS QTL:

  • QTL都是人工群体,有高度的LD衰减,所以需要比较少的标记就可以。但是QTL缩小区间,需要大量的群体才能找到交换单株,工作量巨大。
  • GWAS群体LD衰减距离很快,所以需要高密度的标记。GWAS成为育种群体挖掘基因的更有利工具。进而应用于MAS。
  • 在多基因效益以及基因间互作的复杂遗传结构,GWAS通常可以提供相对于双亲图谱更高的遗传分辨率

SV分析GWAS的思路:

  • SV也可以变为主等位纯合、杂合、次等位纯合的格式,编码为0-1-2的格式,用GAPIT分析完全没问题。
  • 研究表明,SV的GWAS结果和SNP的GWAS结果,重复度在93%以上。同时,7%是SV单独解释的,SV解释抗病性中更大比例的变异。

GWAS中考虑单倍型

  • 填充,低密度填充到高密度,需要用到单倍型
  • 定位基因时,单倍型数据可以降低假阳性

GWAS分析汇总不同模型共有位点:

  • 有共有位点,说明这个位点可信度比较高
  • 没有共有位点,并不意味着假阳性或者错误的结果,还需要进一步验证。

做GWAS的自我灵魂拷问:

《Genome-Wide Association Studies》第一章:GWAS分析的主要步骤和关键要点_人工智能_03

下一篇,介绍《表型数据处理》,欢迎继续关注。