欢迎关注”生信修炼手册”!

对于转录因子而言,我们最想知道的信息就是其对应的靶基因。转录因子相关数据库非常的多,有些数据库直接提供了靶基因的信息,比如TRANSFAC, 有些数据库只提供了motif的信息,比如JASPAR, 我们只能通过软件预测在基因的启动子序列上是否有对应的motif, 从而识别转录因子的靶基因。

TRANSFAC收费,而JASPAR的靶基因预测又需要一定的生信技能,有没有哪个数据库既免费,又直接提供了靶基因数据呢?

这种数据库肯定是存在的,比如之前介绍过的TRRUST等数据库,但是本文的主角是另外一个数据库,Harmonizonme。

将各个​​Resource​​​来源数据库中的原始信息加以整理,得到更加直观,方便使用的数据集​​Datasets​​​,然后将所有的整理好的信息存储在同一个数据库中,就得到了​​Harmonizonme​​数据库,网址如下

​http://amp.pharm.mssm.edu/Harmonizome/​

目前该数据库包含来自66个Resources数据库,114个数据集datasets, 共有57620个基因,295496个属性,71927784个相互作用关系。分类情况如下

转录因子的靶基因,看这一个数据库就够了_数据集

可以看到有非常多种类型的信息,本文只介绍转录因子的靶基因数据集,在官网首页,根据关键词检索相关的数据集,示意如下

转录因子的靶基因,看这一个数据库就够了_数据集_02

最终可以检索到以下6个转录因子靶基因数据集

转录因子的靶基因,看这一个数据库就够了_官网_03

以TRANSFAC Curated Transcription Factor Targets数据集为例,链接如下

​http://amp.pharm.mssm.edu/Harmonizome/dataset/TRANSFAC+Curated+Transcription+Factor+Targets​

该数据集是手工收集整理的转录因子靶基因数据集,示意如下

转录因子的靶基因,看这一个数据库就够了_官网_04

共包括201个转录因子的靶基因信息,点击每个转录因子,可以看到相关的靶基因,示意如下

转录因子的靶基因,看这一个数据库就够了_数据集_05

除了在线浏览特定转录因子的靶基因外,还可以方便的下载该数据集,点击下图中红色方框标识的文件进行下载即可

转录因子的靶基因,看这一个数据库就够了_数据库_06

该文件列数很多,前几列示意如下

source

source_desc

source_id

target

target_desc

target_id

SLC16A9

na

220963

ALX1

na

8092

SLC26A3

na

1811

ALX1

na

8092

ABHD17B

na

51104

ALX1

na

8092

这里的​​id​​​指的是基因对应的Entrez Id, ​​source​​​值的是靶基因,​​`target​​值的是转录因子,通过该数据库可以方便的得到转录因子和靶基因之间的调控关系。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

转录因子的靶基因,看这一个数据库就够了_数据集_07