简介

表观遗传学:表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因组印记(genomic imprinting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。


1 主要内容



DNA甲基化





在甲基转移酶的催化下,DNA的CG两个核苷酸的胞嘧啶被选择性地添加甲基,形成5-甲基胞嘧啶,这常见于基因的5'-CG-3'序列。大多数脊椎动物基因组DNA都有少量的甲基化胞嘧啶,主要集中在基因5'端的非编码区,并成簇存在。甲基化位点可随DNA的复制而遗传,因为DNA复制后,甲基化酶可将新合成的未甲基化的位点进行甲基化。DNA的甲基化可引起基因的失活,DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,甲基化达到一定程度时会发生从常规的B-DNA向Z-DNA的过渡,由于Z-DNA结构收缩,螺旋加深,使许多蛋白质因子赖以结合的原件缩入大沟而不利于转录的起始,导致基因失活。另外,序列特异性甲基化结合蛋白(MBD/MeCP)可与启动子区的甲基化CpG岛结合,阻止转录因子与启动子作用,从而阻抑基因转录过程。

DNA甲基化主要形成5-甲基胞嘧啶(5-mC)和少量的N6-甲基腺嘌呤(N6-mA)及7-甲基鸟嘌呤(7-mG)。

【本科生实验课(一)】表观遗传你该知道的几点内容_Java

图片来源:http://s4.sinaimg.cn/orignal/002eYBZDzy78vTfjvMf63

附一篇关于DNA甲基化在基因组印记中的作用的文章。

https://www.nature.com/nature/journal/v366/n6453/abs/366362a0.html





Pubmed文献检索  DNA methylation:

DNA methylation commonly refers to the covalent addition of a methyl (−CH3) group from the s-adenosylmethionine (SAM) to thefifth carbon of the cytosine base (5mC) which is catalyzed by DNA methyltransferases(DNMTs) enzymes . It is extensively demonstrated that DNA methylationplays a key role in chromosomal stability, gene expression, genome imprinting,and transcriptional silencing of foreign DNA fragments




组蛋白修饰





蛋白修饰是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修饰的过程。

在哺乳动物基因组中,组蛋白则可以有很多修饰形式.。一个核小体由两个H2A,两个H2B,两个H3,两个H4组成的八聚体和147bp缠绕在外面的DNA组成. 组成核小体的组蛋白的核心部分状态大致是均一的,,游离在外的N-端则可以受到各种各样的修饰,,包括组蛋白末端的乙酰化,甲基化,磷酸化,泛素化,ADP核糖基化等等. ,这些修饰都会影响基因的转录活性。

目前对表观基因抑制基因表达的机制研究十分活跃,表观基因改变的两个最主要机制就是DNA 甲基化和组蛋白修饰,后者包括甲基化、乙酰化、磷酸化、泛素化和ADP一糖基化,其中以乙酰化修饰最为重要。

【本科生实验课(一)】表观遗传你该知道的几点内容_Java_02

图片来源:https://www.whatisepigenetics.com/histone-modifications/

附一篇关于lncRNA作为组蛋白修饰的支架的文章。

http://science.sciencemag.org/content/329/5992/689





Pubmed文献检索  histone modification:

The biological functions of these histones aremediated by the modification of amino acid residues in the histones. A varietyof histone modifications have been reported to date, including lysineacetylation, lysine methylation, arginine methylation, serine phosphorylation,and lysine ubiquitylation [3]. The trimethylation of H3 lysine 4 (H3K4me3) and theacetylation of H3 lysine 27 (H3K27ac) have been well studied as active marks oftranscription, while the trimethylation of H3 lysine 27 (H3K27me3) is regardedas an inactive mark [4]. Although the biological functions and molecularmechanisms of these histone modifications have been the focus of many recentinvestigations, few studies have examined the functions of histonemodifications in a dynamic system, such as development.




计算表观遗传学




应用及开发生物信息学方法(统计分析,模式识别等)解决生物医学相关的表观遗学问题。

当前及未来的研究方向:

预测的角度研究表观遗传现象

应用生物信息学工具建立遗传与表观遗传调控网络

表观遗传数据库

建立在表观遗传机制基础的功能基因组及比较基因组研究

计算表观遗传学研究内容:

数据层面: DNA methylation, Histone modification,ncRNA, Nuclesome

方法层面:数据存储、处理,数据挖掘算法和软件

功能层面:疾病、发育、进化中的应用,表观遗传标记识别

附一篇关于研究DNA甲基化在动物中的进化的计算方法的文章,这是一篇方法类文章。

http://www.tandfonline.com/doi/abs/10.4161/epi.4.8.10345





pubmed检索:

At the core of this new waveof research is the use of computational tools that play critical roles not onlyin directing the selection of key experiments, but also in formulating newtestable hypotheses through detailed analysis of complex genomic informationthat is not achievable using traditional approaches alone. Epigenomics, whichcombines traditional genomics with computer science, mathematics, chemistry,biochemistry and proteomics for the large-scale analysis of heritable changesin phenotype, gene function or gene expression that are not dependent on genesequence, offers new opportunities to further our understanding oftranscriptional regulation, nuclear organization, development and disease.




差异甲基化区域




差异性甲基化区域(Differentially Methylated Region,DMR)被认为在基因印记调节中起重要作用,DMR即卵子和精子中对同一基因位点不同程度的甲基化区域,而这些DMR决定其控制基因是否表达。

根据目前研究,DMR 调控基因印记的可能机制有三种:1)位于启动子区域的DMR 高度甲基化直接导致该等位基因沉默;2)通过甲基化特异性转录因子CTCF 与非甲基化的DMR 结合形成绝缘体,使启动子不能与上游增强子结合而抑制该等位基因转录;3)DMR甲基化抑制非编码RNA(noncodingRNA,ncRNA)的表达,而位于另一条非甲基化的等位基因上的ncRNA表达,表达的ncRNA引起该等位基因沉默。

附一篇关于在正常及transformed的人类细胞中识别差异甲基化区域的文章。

https://www.nature.com/ng/journal/v37/n8/abs/ng1598.html




染色质状态





染色质状态可粗略地分为常染色质和异染色质,染色质的修饰与染色质的状态密切关联,不同类型的染色质表观遗传修饰对于染色质的状态具有不同的作用,一些修饰(H3K27me3、DNA 甲基化 等)会使得染色质固缩,位于固缩染色质区域的基因沉默.而另一些修饰却能使染色质疏松、活化,如组蛋白的乙酰化和 H3K4me3 等. 随着对染色质 研究的深入,可以将染色质的状态进行进一步细分.染色质表观修饰的不同组合对应不同状态的染色质状态,或者说染色质状态可以由位于其上的表观遗传标记来刻画表征,因此,在计算上,可以通过分析染色质表观修饰的类型和组合方式来细化染色质的状态,这种细化可进一步明确处于各类染色质状态的特点,有利于分析处于这些染色质中基因的转录活性,也有助于解析表观遗传修饰(尤其是 染色质修饰)的基因调节作用。

附一篇关于X染色体失活的研究进展的文章。

http://www.sciencedirect.com/science/article/pii/S0959437X14001051




基因组印记




基因组印记(Genomic imprinting):又称遗传印记,是通过生化途径,在一个基因或基因组域上标记其双亲来源信息的生物学过程。这类基因称作印记基因,这类基因表达与否取决于它们所在染色体的来源(父系或母系)以及在其来源的染色体上该基因是否发生沉默。有些印记基因只从母源染色体上表达,而有些则只从父源染色体上表达。

特点:

①基因组印记遍布基因组:例如在人基因组中有100多个印记基因,成簇时形成染色体印记区,连锁时会有不同的印记效应;

②基因组印记的内含子小:雄性印记基因重组频率高于雌性印记基因;

③印记基因组织特异性表达:例如小鼠中Ins1、Ins2是等位印记基因,在卵黄中Ins1单等位基因表达,在胰腺中Ins1、Ins2同时表达;

④基因组印记在世代中可以逆转:个体产生配子时上代印记消除,打上自身印记。

附一篇关于DNA甲基化在基因组印记中的作用的文章。

https://www.nature.com/nature/journal/v366/n6453/abs/366362a0.html





Pubmed检索  genomic imprinting

There is increasing evidence that genomic imprinting,a process by which certain genes are expressed in a parent-of-origin specificmanner, can influence neurogenetic and psychiatric manifestations.



1 表观遗传学工具 



Bismark



具体的使用方法:Bismark工具介绍



MACS



MACS (Model-based Analysis of ChIP-Seq )

 基于模型的ChIP-Seq分析(MACS)是一种设计用于鉴别来自ChIP-seq数据读富集区域的计算机方法。

用法:

macs <-t tfile> [options]

选项:

--version             显示程序版本号并退出。1.3.2

-h, --help            显示这个帮助信息并退出

 -tTFILE, --treatment=TFILE   ChIP-seqtreatment files. 必需

-c CFILE, --control=CFILE     Control文件

--name=NAME           实验名,用来产生输出文件名字。默认是"NA"

 --format=FORMAT       tag文件的格式。"ELAND"或 "BED"。默认是"BED"

Format of tag file, "AUTO","BED" or "ELAND" or

"ELANDMULTI" or "ELANDMULTIPET"or "ELANDEXPORT" or

"SAM" or "BAM" or"BOWTIE".

--gsize=GSIZE         基因组大小,默认2700000000

--tsize=TSIZE         Tag大小,默认25

--bw=BW               Band宽度,这个值被用来构建shifting模型。若--nomodel被设定,这个值的两倍将被设置为扫描窗口的宽度。默认300

--pvalue=PVALUE       用来进行peak检测的Pvalue的阈值, 默认1e-5

--mfold=MFOLD         选择对背景有高置信度富集的区域来构建模型。默认32

--wig                 是否保存每个bp的shifted原始tag count到一个wig文件中。这个过程耗时耗空间。

--verbose=VERBOSE     设置verbose层次。0: 仅显示关键信息, 1:显示附加警告信息, 2: 显示处理过程,3: 显示调试信息。默认2

--nolambda            是否用局部lambda。若True, MACS将使用lambda_background作为local_lambda

--lambdaset=LAMBDASET 用来计算动态lambda的,临近区域的3个层次,以bp给出,默认"1000,5000,10000"

--nomodel             是否构建shifting模型。若True,MACS将不构建模型,默认它意味着shifting大小是100, 尝试设置shiftsize来改变它。默认False

--shiftsize=SHIFTSIZE The arbitrary shiftsize in bp。仅当nomodel为true时可用。默认100

--diag                是否产生diagnosis报告。要耗费9X的时间。默认False




UCSC  Genome Browser




UCSC Genome Browser是由Universityof California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具。站点用户可以通过它可靠和迅速地浏览基因组的任何一部分,并且同时可以得到与该部分有关的基因组注释信息,如已知基因,预测基因,表达序列标签,信使RNA,CpG岛,克隆组装间隙和重叠,染色体带型,小鼠同源性等。用户也可以因为教育或科研目的加上他们自己的注释信息。UCSC  Genome Browser目前应用相当广泛,比如Ensembl就是使用它的人类基因组序列草图为基础的。约有一半的注释信息来自通过公开的数据计算得出,另外一半来自世界各地的科研工作者,支持数据库检索和序列相似性检索,Genome Browser本身不下任何结论,只是收集各种信息供用户参考




Galaxy




平台的主要是针对第二代测序技术的数据分析,主要特点是:

1.简单应用:用户无需任何编程经验,只需简单的制定参数就可快速简单的运行任何分析工具或分析流程;

2.重现性:Galaxy能让任何用户都可以重复和了解一个完整的计算分析过程;

3.协作性:通过超链接的方式用户能分享和发布任何分析流程,并能创建互动的网页描述一个完整的分析过程。




QDMR




QDMR 基于信息熵的差异甲基化区域的筛选方法

DNA甲基化在转录调控和染色质重塑中扮演着重要的角色,并参与发育、衰老和一些复杂疾病过程,任基因组范围内筛选差异甲基化区域对揭示表观遗传修饰在组织细胞分化过程的影响至关重要。为此,开发了在全基因组范围内筛选差异甲基化区域的方法,QDMR(Quantitative Differentially MethylatedRegions)。该方法利用改进后的香农信息熵对同一区域在各样本间的甲基化差异进行定量化,基于定量的甲基化差异,通过从甲基化概率模型中得到的阈值筛选差异甲基化区域。此外,ODMR还可以通过本研究中定义的相对特异性测度区分出组织特异的低/高甲基化DMR。QDMR提供了一个有效方法用来高通量地识别参与表观遗传调控的功能元件。


1 表观遗传学计划 




TCGA




肿瘤基因组图谱 (TCGA) 计划由美国 National Cancer Institute(NCI) 和 National HumanGenome Research Institute(NHGRI)于 2006 年联合启动的项目,目前共计研究 36 种癌症类型。

TCGA 利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制。提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。最终完成一套完整的与所有癌症基因组改变相关的「图谱」。

TCGA 数据类型分为以下几种:

【本科生实验课(一)】表观遗传你该知道的几点内容_Java_03

TCGA 数据水平及类型:


【本科生实验课(一)】表观遗传你该知道的几点内容_Java_04




Roadmap projcet




Roadmap Epigenomics Mapping Consortium是由美国国立卫生研究院路启动,目标是生产一种人类表观基因组数据的公共资源,以催化基础生物学和疾病导向研究。该协会利用新一代测序技术构建的实验管道来绘制DNA甲基化、组蛋白修饰、染色质可及性和小RNA转录本,在干细胞和原发性体外组织中被选择,以代表通常涉及人类疾病的组织和器官系统的正常副本。该协会希望提供一组正常的表观基因组,这些表观基因组将提供一个框架或参考,以便在广泛的未来研究范围内进行比较和整合。该联盟还旨在通过快速发布原始序列数据、表观基因组特征和更高层次的综合地图,以缩小数据生成与公众传播之间的差距。该联盟还致力于发展、标准化和传播议定书、试剂和分析工具,使研究社区能够利用、整合和扩大这一数据体。

【本科生实验课(一)】表观遗传你该知道的几点内容_Java_05

地址:http://www.roadmapepigenomics.org/




ENCODE




ENCODE: Encyclopedia of DNA Elements

ENCODE计划联盟是由人类基因组研究所(NHGRI)资助成立的研究小组。ENCODE的目标是建立人类基因组中功能元素的一个完整的部件列表,包括在蛋白质和RNA水平上作用的元素,以及控制细胞和激活基因的细胞和环境的调控元件。

【本科生实验课(一)】表观遗传你该知道的几点内容_Java_06

地址:https://www.encodeproject.org/


材料作者(以下排名不分先后):

牛苗苗、刘文超、刘肖琴、谢艺