欢迎关注”生信修炼手册”!

相比全基因组,全外显子组只针对外显子区域进行测序,更加的经济高效。全外显子利用特定的芯片捕获外显子区域进行测序,在这个思想的基础上进一步延伸,如果只关注与疾病或者特定表型相关的某些基因,只需要针对这些区域进行测序就可以了。

通过PCR或者芯片捕获的方式,富集感兴趣的目的区域的reads然后进行测序,这就是target sequencing, 也称之为target resequencing, taget-NGS,tg-NGS等。其中,针对某种特定疾病或者表型,将相关的候选基因集中起来,只针对这些基因进行测序,就是通常所说的panel测序。

目的区域靶向测序更加的经济高效,可以实现500到1000X, 甚至更高的测序深度,有助于发现罕见变异,挖掘疾病相关基因,在临床研究中应用广泛。目前通过靶向测序挖掘CNV的相关工具相对而言比较少,一篇发表在ScienceDirect上的文章对相关工具进行了测评,文章链接如下

​https://www.sciencedirect.com/science/article/pii/S1383574218300371​

标题如下

靶向测序的CNV分析简介_处理方法

文章中列举的针对tg-NGS测序的CNV工具如下

靶向测序的CNV分析简介_处理方法_02

WES也算是靶向测序的一种,所以针对WES的工具也一起进行了测评,最终进行测评的工具列表如下

  1. ExomeCNV
  2. ExomeCopy
  3. CONTRA
  4. ExomeDepth
  5. CONIFER
  6. CANOES
  7. CODEX
  8. CLAMMS
  9. CoNVaDING
  10. DECoN
  11. CNVkit
  12. SeqCNV

所有的工具都是基于read depth的分布来预测CNV,利用平均测序深度300X的模拟数据,测试结果如下

靶向测序的CNV分析简介_建模_03

A和B分别表示灵敏度和特异性,不同颜色代表control样本的多少,可以看到,名列前茅的分别是DECoN, exomeDepth, exomeCNV。

对不同软件的假阴性率进行评估,结果如下图所示

靶向测序的CNV分析简介_系统误差_04

可以看到各种情况下,DECoN的假阴性率都是最低的。考虑到每个软件都有自己的限制,综合多款软件的结果来进行分析,不用个数的最佳软件组合汇总如下

靶向测序的CNV分析简介_系统误差_05

二代测序CNV检测的最大挑战是各种系统误差,GC含量,重复序列,捕获效率,PCR偏倚等导致的测序深度分布不均匀,处理方法可以大致分为两种,第一种考虑各种因素进行建模,校正系统误差,第二种通过对照样本,通过实验样本和对照样本的比较,来减少系统误差的影响。

对于靶向测序而言,其测序深度分布的影响因素过多,很难有一个最佳的模型可以校正系统误差,所以采用对照样本的方式是比较主流的算法。

综合来看,DECoN软件在本次测评中效果是最好的,灵敏度和特异性都是最佳,其次有ExomeDepth和ExomeCNV。对于panel测序的CNV鉴别,推荐使用这3款软件。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

靶向测序的CNV分析简介_系统误差_06