哺乳动物印记基因查询系统
1. 总述
通过文献检索的方式,从18,696篇已经发表的与印记相关的论文中收集了包括人和小鼠在内的8个哺乳动物的539个印记基因的印记状态及研究背景信息,并整合了高通量的表观基因组数据及印记基因基因组特征,构建了一个哺乳动物印记基因的整合信息资源平台MetaImptint。数据库中还提供了印记基因的在线可视化工具ImprintedGeneBrowser,可以获取印记基因所在基因组区域上下游的遗传和表观遗传特征图谱。此外,以印记基因为背景的功能富集分析和差异表观遗传学特征分析也可以通过MetaImprint的在线平台完成。相关成果已经在著名发育学相关杂志《Development》上发表(2014 SCI IF:6.462)。
△ 图1 MetaImprint信息平台首页
2. 平台简介
基因组印记,是一种复杂的表观遗传学现象,它使得基因的表达在组织和细胞系间呈现出亲本差异的表达模式,并对个体的生长和发育起到了关键的调控作用。一般情况下,父本等位基因的表达对胚胎的发育起到促进的作用,而母本等位基因的表达则倾向于抑制胚胎的生长。印记主要发生在哺乳动物中,主要是为了平衡子代从亲本中所获取的资源。基因组印记主要参与了哺乳动物胚胎发育的过程,并且已有报道印记异常会导致诸如先天性疾病、不孕不育、葡萄胎、缺陷的辅助生殖细胞、癌症等复杂疾病的发生。
通过人工文献检索的方式,从18,696篇已经发表的与印记相关的论文中收集了包括人和小鼠在内的8个哺乳动物的539个印记基因的印记状态及研究背景信息。共收集到317个人类印记基因,146小鼠印记基因,1个狗的印记基因,35个牛的印记基因,3个羊的印记基因,29个猪的印记基因,7个大鼠印记基因和1个兔子印记基因,详细的信息见表1。
表1 MetaImprint中各物种印记基因的收录汇总
为了展示印记基因所处基因组环境的遗传和表观遗传特征,我们还收录了印记控制区,单核苷酸多态,重复元件,等为差异甲基化的信息以及高通量检测的甲基化谱和组蛋白修饰的数据。用户可以利用在线的工具Imprint gene browser、Functional enrichmentanalysis和ANOVA analysis进行数据的可视化和分析。用户也可以通过MetaImprint下载所有涉及的数据以进行更加深入的研究。
3. 印记基因检索入口
△ 图2 快速查询输入框
用户可以通过数据库首页的快速查询入口(图2)提交单个基因或者一个基因列表来进行查询。例如,输入一个基因集合:H19、IGF2、MEG8、PEG3、DLK1、GNAS、INPP5F、INS、DCN、IMPACT、IGF2R、PEG10、PHLDA2和DIO3,并且保持一行一个基因的格式,然后点击“QuickSearch”的按钮我们将会得到如图3所示的结果。
△ 图3 快速查询结果
△ 图4 印记基因检索
从导航菜单Search > 1:the imprinted gene search engine或者是首页Quick Search > Advanced > 1: the imprinted gene search engine可以进入印记基因的查询页面(图4)。通过设置物种信息、基因名、染色体位置信息、表达的等位和印记状态可以实现按印记基因信息检索数据库的目的(图5)。
△ 图5 按印记基因信息进行检索参数配置
印记基因相关疾病检索入口
△ 图6 印记基因相关疾病检索
从导航菜单Search > 2:the disease search engine或者是首页Quick Search > Advanced> 2: the disease search engine可以进入印记相关疾病的查询页面(图6)。通过设置基因名和疾病名称可以实现按疾病信息检索数据库的目的(图7)。
△ 图7 按疾病信息配置印记基因检索参数
△ 图8 印记基因基因组可视化
从导航菜单Search > 3:the imprinted gene browser或者是首页Quick Search > Advanced> 3: the imprinted gene browser可以进入印记基因可视化页面(图8)。通过设置印记基因的基因组位置信息(图9)或者点击基因组染色体条带图谱中对应的区域(图10)可以实现按疾病信息检索数据库的目的。
△ 图9 印记基因基因组可视化位置参数配置
△ 图10 基因组染色体条带图谱(红色标记的位置为已知的印记控制区)
从导航菜单ImprintedGeneBrowser、印记基因查询结果或者是首页Quick Search > Advanced > 3: the imprinted gene browser可以进入印记基因浏览器页面(图11)。通过浏览器中的物种标签可以实现不同物种间的参考基因组转换,浏览器中的move和zoom工具可以实现小范围基因组窗口的移动变换。在该版本的基因组浏览器中,我们还发布了与参考基因组版本相匹配的DNA甲基化、组蛋白修饰、重复序列、多核苷酸多态、印记控制区和等为差异甲基化状态等数据,用户可以在可视化配置窗中完成感兴趣数据集的装配显示。
△ 图11 印记基因基因组浏览器界面
对应于不同的印记状态,我们在浏览器中以不同的颜色予以标记。其中,粉色标记的基因表示在疾病中表现为印记缺失的状态;灰色标记的基因表示为非印记;橘色标记的基因表示为算法预测的印记基因;红色标记的基因表示印记基因;对于其他正常转录的基因则标记为蓝色(图12)。
△ 图12 印记状态图例
基于MetaImprint,可以对印记基因所在基因组区域的表观遗传学修饰进行差异分析,例如在正常肝组织和肝癌患者之间进行比较分析,选定分析对象为全部317个人类印记基因对应的基因组区域的甲基化水平,共筛选得到97个差异甲基化的印记基因,其中已有11个基因被现有的研究所证实。在图13和图14中显示的为印记相关的表观遗传修饰差异分析的参数提交页面,图15给出的是差异分析的结果页面。
△ 图13 印记相关的表观遗传修饰差异分析(参数提交页面)
△ 图14 印记相关的表观遗传修饰差异分析(表观遗传数据选择页面)
△ 图15 印记相关的表观遗传修饰差异分析(结果页面)
利用功能富集分析的方法对印记基因所参与的机体功能进行了注释,发现317个人类印记基因显著富集在胚胎形态形成、胚胎器官发育以及组织特异性形成等生物学过程。图16显示的为富集分析参数提交页面,图17显示的是富集分析的结果页面。
△ 图16 印记基因功能富集分析参数配置页面
△ 图17 印记基因功能富集分析结果页面
参考文献:
Wei, Y., Su, J., Liu, H., Lv, J.,Wang, F., Yan, H., Wen, Y., Liu, H., Wu, Q. and Zhang, Y. (2014) MetaImprint:an information repository of mammalian imprinted genes. Development, 141,2516-2523.