欢迎关注”生信修炼手册”!

OnGene是一个肿瘤基因的数据库,通过文献检索的方式获得了803个肿瘤基因,文章的链接如下

​http://dx.doi.org/10.1016/j.jgg.2016.12.004​

数据库网址如下

​http://ongene.bioinfo-minzhao.org/index.html​

数据库构建的pipeline如下图所示

ONGene:基于文献检索的肿瘤基因数据库_html

首先在pubmed中用以下几个关键词进行检索

  1. oncogene
  2. oncogenic
  3. oncoprotein
  4. proto-oncogene

得到候选的17033篇文献,然后从​​long non-coding RNA​​​和​​oncogene​​两个关键词检索,得到435篇文献。另外又从oncomirdb和miRCancer数据库中得到肿瘤相关的miRNA。

对以上得到的文献进行人工核对,最终筛选得到了803个有文献支持的肿瘤基因,并对这些基因进行了以下几种数据分析

  1. 功能注释,提供了基因名称,参与的通路,相关疾病等注释信息
  2. 差异分析,利用TCGA中的表达谱数据,进行肿瘤和正常样本的差异分析
  3. 与lncRNA的共表达分析,利用MiTranscriptome数据库中的表达谱数据,分析肿瘤基因与lncRNA之间的共表达
  4. 突变信息注释,利用TCGA中的mutation信息进行注释

通过首页的​​browser​​​菜单,可以浏览肿瘤基因的相关信息,以蛋白编码基因​​MYC​​为例,包含以下几个部分的结果

1.  Gene information

包含了基因名称,染色体位置,对应的pathway与疾病,序列等信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_数据库_02

2. Literature

展示了该基因相关的文献和摘要信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_html_03

3. Expression

展示该基因在样本中的表达量信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_数据库_04

4. lncRNA

展示与该基因存在共表达的lncRNA信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_html_05

5. Mutation

展示该基因上存在的mutation信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_数据库_06

6. Homolog

展示其他物种中该基因的同源基因信息,示意如下

ONGene:基于文献检索的肿瘤基因数据库_数据_07

该数据库中的信息是可以免费下载的,链接如下

​http://ongene.bioinfo-minzhao.org/download.html​

ONGene:基于文献检索的肿瘤基因数据库_数据_08

对于肿瘤研究而言,该数据库非常值得参考,可以帮助我们快速的筛选候选的肿瘤基因。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

ONGene:基于文献检索的肿瘤基因数据库_html_09