欢迎关注”生信修炼手册”!

peak calling的核心是比较input和抗体处理样本基因组区域测序深度分布的差异,所以样本的测序深度分布可以作为质控的一个标准,本文介绍如何通过deeptools来绘制样本测序深度分布图。

通过​​plotCoverage​​命令,可以绘制样本测序深度的分布,由于测序量较大,为看节省运行时间,默认随机抽取10M的reads,来计算测序深度的分布,基本用法如下

plotCoverage \
-b H3K4Me1.bam H3K4Me3.bam H3K27Me3.bam H3K9Me3.bam
--plotFile example_coverage \
-n 1000000 \
--plotTitle "example_coverage" \
--outRawCounts coverage.tab \
--ignoreDuplicates \
--minMappingQuality 10

输出结果示意如下

chip_seq质量评估之coverage分析_运行时间

左侧是测序深度频率分布图,右侧是大于该测序深度的频率分布图, 以​​H3K4Me1​​这个样本为例,左侧图中横坐标为2的位置,对应纵坐标约为0.05,说明测序深度为2的区域包含了5%的reads,右侧图中横坐标为2的位置,对应的纵坐标约为0.15, 说明在基因组上有15%的区域测序深度都大于等于2。

这种频率分布图单个样本实际上意义不大,主要是通过多个样本的比较,查看是否有某个样本和其他样本差距很大,从而判断离群值样本。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

chip_seq质量评估之coverage分析_运行时间_02