文章目录



一、介绍


  • ChIP-seq,测序方法

  • ​ChIP​​ 指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),
  • ​seq​​ 指的是二代测序方法

  • 作用:识别蛋白质与DNA互相作用情况
  • 原理:染色质免疫共沉淀 + 二代测序
  • 应用:常用于转录因子结合位点和组蛋白修饰位点的研究

二、测序原理

1、使用甲醛将目标蛋白(组蛋白,录因子等)与染色质交联固定起来

一文读懂 ChIPseq_转录因子

2、从细胞裂解液分离基因组DNA,通过超声打断DNA为一定长度的小片段

一文读懂 ChIPseq_生物信息学_02

3、添加与目标蛋白质特异的抗体,该抗体会与目标蛋白形成免疫结合复合体沉淀,收集这些沉淀

免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA

一文读懂 ChIPseq_转录因子_03

4、去交联,分开蛋白与DNA,纯化DNA即可得到染色质免疫沉淀的DNA样本

一文读懂 ChIPseq_转录因子_04

5、建立好文库,用测序仪进行测序

详细测序过程可以参考:https://zhuanlan.zhihu.com/p/58708887

一文读懂 ChIPseq_ChIPseq_05

三、检测蛋白质与DNA序列的结合峰

1、测序片段匹配到参考基因组

将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组。

很显然,如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。

一文读懂 ChIPseq_组蛋白_06

2、检测峰

将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。

这里需要知道,ChIPseq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。

我们一般用 ChIPseq 检测录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:

录因子结合的特征峰,峰型高,而且窄:

一文读懂 ChIPseq_ChIPseq_07

组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:

一文读懂 ChIPseq_生物信息学_08

当然我们也可以使用,UCSC基因组浏览器显示。

一文读懂 ChIPseq_表观遗传学_09

3、提高峰质量

一般在做ChIPseq时,会加入一组空白对照(control),提高峰质量,那么为什么?


  • 一般检测出的峰值会有背景噪音,也就是文库会夹渣一些没有用抗体捕获的DNA片段也被测序了。
  • 开放的染色质区域比封闭的区域更容易断裂
  • 序列在基因组中分布不均
  • 允许我们在比对的控件中与相同区域进行比较
  • 消除 ENCODE 的 Black list的影响

所以会准备空白对照,排除假阳性,对照组有有两种类型:


  • input DNA:不用任何抗体捕获的DNA;
  • mock IP DNA:用不含有抗体的DNA

这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。

四、影响ChIPseq测序结果的因素

1、免疫共沉淀的影响

  • 高效特异性抗体
  • 起始样本量
  • ChIP DNA 产量

  • 细胞类型
  • 标记或蛋白质丰富程度(组蛋白比TF具有更高的结合覆盖率)
  • 抗体质量



对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。

对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。

-Subhash Tripathi,ResearchGate


  • 染色质片段

  • 片段大小:影响ChIP-seq中的信噪比
  • 因细胞类型而异
  • 偏向启动子区域的片段会在ChIP 和对照样品中的启动子上引起ChIP-seq富集

2、测序的影响

  • Reads 长度

  • 较长的 Reads 和双末端 Reads 可提高匹配率
  • 对于等位基因特异性染色质事件,转座因子研究是必需的

  • 避免分批次
  • 序列输入对照的深度等于或大于IP样本
  • 测序深度

  • 对于转录因子:最小5-10M
  • 对于组蛋白修饰宽谱图则更高:标准为20-40M


测序深度的对组蛋白修饰检测的影响

下面是在不同测序深度下检测人的 H3K4me3 组蛋白修饰ChIP图谱。

绿色框对应于基于SPP宽峰检测方法得到的显著富集区域。

在 5M (500 Reads) 中,未检测到突出显示的富集区域。

一文读懂 ChIPseq_转录因子_10

同样,我们换成 H3K27me3 组蛋白修饰。

这时在3.5M和10M 的低深度处未检测到突出显示的HOXD11和HOXD-AS1基因座处的富集区域(蓝色框)。 一文读懂 ChIPseq_转录因子_11

从每个子样本中H3K4me3,H3K36me3和H3K27me3回收的全部数据中获得的显著富集区域的百分比一文读懂 ChIPseq_表观遗传学_12

总的来说,随着测序深度增加,组蛋白修饰检测比例开始会快速增加,随后达到平稳。测序深度饱和点取决于组蛋白修饰和所研究的物种基因组。

3、重复样和重现性

  • 重复多次通常比更高的深度更有效
  • 最好是低深度测序高质量样本,而不是高深度低质量样本

参考:

​​

​https://en.wikipedia.org/wiki/ChIP_sequencing#/media/File:Chromatin_immunoprecipitation_sequencing.svg​

​https://www.abcam.com/epigenetics/studying-epigenetics-using-chip​