摘要
表观遗传改变,即DNA甲基化和染色质结构的破坏,被认为是肿瘤发生的普遍特征。髓母细胞瘤是一种临床上具有挑战性的恶性肿瘤。本文对四个不同肿瘤亚组( WNT通路,SHH通路,第3组型和第4组型)的周期性改变进行了识别,许多病例仍缺乏明显的基因驱动。本文使用样本为34个人类和5个小鼠的肿瘤加上8个人和3个鼠的正常对照,加上全基因组、RNA-seq、 WGBS和CHIP-seq数据。
这组综合数据可以解释基因组、表观基因组、转录组之间的相互作用,和它们对髓母细胞瘤的影响。最值得注意是与基因表达增加有关的低甲基化区域,可以从转录起始位点延伸至下游数万碱基。
髓母细胞瘤是一种胚胎性肿瘤,分化标记物很少和最小的正常细胞浸润的特点,使其非常适合表观基因组研究。
相关区域(CRs)的识别:
将长度小于100bp的,在注释基因附近或内部的,相邻的5个CpG作为一个窗口,然后计算这些窗口和基因表达的皮尔森相关系数,保留大于0.5或小于负0.5的窗口,然后进行置换检验(样本顺序的置换)来估计窗口P值,保留P<0.001(在小鼠中0.01)的窗口作为相关窗口,覆盖相关窗口并合并为CRs。CRs需要包含至少10个CpGs。所有CpG位点甲基化值的平均数作为CRs的平均甲基化水平。
启动子下游区域(promoterdownstream correlating regions (pdCRs))的识别:
从TSS下游500bp(为了不覆盖到基因启动子上,启动子范围:TSS上游1500bp,下游500bp)开始的CpG会被赋予一个分数,如果该CpG位点在negative CR则+1,否则-2。非甲基化的CpG位点(平均甲基化水平<0.15)不计分。每一个下游CpG的分数会被加和,直到分数和恰好大于0的CpG终止,将这些CpG位点相连作为pdCR
pdCRs影响基因表达:
从启动子延伸到下游几千KB的负相关区域(promoter downstream correlating regions(pdCRs)),影响了1194个基因。负相关CpG位点密度峰值在TSS下游2kb。

如RUNX2基因编码激活WNT通路的转录因子,显示WNT特异的pdCRs去甲基化和基因高表达。

8.4%的表达基因都与pdCRs相关,它们的甲基化和表达水平在不同肿瘤亚组间有明显差异。20%亚组特异表达的基因含有pdCR,表明这种甲基化模式在决定肿瘤分子变异的特有转录组方面发挥重要作用。

对不同组织的WGBS数据分析揭示了pdCRs是一个全局特征,在同质细胞群更显著。以前报道过的CpG
‘shores’和 ‘shelves’有类似的模式,它们与组织特异表达和活跃的染色质标记H3K4me3有关。两个髓母细胞瘤细胞系(D425
andMEB-MED-8A)的ChIP-seq数据分析证实了pdCRs的H3K4me3覆盖。结果显示在甲基化和表达关系中,pdCRs是丰富的并且之前未被重视的模式区域。
这种低甲基化的可能的解释是在细胞分裂过程中RNA聚合酶占用区域(DNA甲基转移酶不可进入)的被动甲基化丢失,或为了提高基因表达的调控过程。作者提供了SHH髓母细胞瘤和其前体细胞GNPs(小脑颗粒神经元前体)的WGBS数据。当比较小鼠肿瘤和前体细胞时,检测到了大于2kb的161个pdCRs。
如Pdlim3在人类和小鼠髓母细胞瘤中显示了明确的pdCR和高表达,GNPs中却没有。其他SHH髓母细胞瘤基因比如Ptch1, Cdk6和 Boc,显示类似的模式。因此尽管一些亚组的DNA差异甲基化可能与发育谱系表观遗传的‘fingerprint’或‘memory’有关,但在肿瘤发展中,体细胞也会发生改变

髓母细胞瘤候选基因LIN28B:
作者接下来识别了被pdCR调控的新的启动子,使用43个髓母细胞瘤和7个控制样本的RNA-seq数据评估新的第一外显子。发现了在RefSeq中的1937个基因中2479个未注释外显子。其中1,714个在GENCODE中被列出,为文本的方法提供了支持。为了避免和已知启动子混淆,作者筛选了距离已知起始位点上游15kb以外的新外显子。262个这样的外显子中,49个显示pdCR的模式。
值得注意的是,miRNA处理基因LIN28B在几乎所有Group 3、Group 4髓母细胞瘤中新起始位点的pdCR是去甲基化的,且高表达,然而已知promoter是高甲基化的。
LIN28B调控多个致癌过程,部分通过下调肿瘤抑制LET-7miRNA家族。Group 3、4髓母细胞瘤显示大多数LET-7 miRNAs低表达,LIN28B高表达与不良预后相关,对于Group 3 、 4也是这样。

参考文献:
Hovestadt, V., et al., Decoding the regulatory landscape ofmedulloblastoma using DNA methylation sequencing. Nature, 2014. 510(7506): p. 537-41.
往期「精彩内容」,点击回顾
DNA测序历史 | CircRNA数据库 | Epigenie表观综合 | 癌症定位
BWA介绍 | 源码安装R包 | CancerLocator | lme4 | 450K分析
乳腺癌异质性 | BS-Seq | 隐马模型 | Circos安装 | Circos画图
KEGG标记基因 | GDSC | Meta分析 | R线性回归和相关矩阵
精彩会议及课程,点击回顾
















