欢迎关注”生信修炼手册”!

Gene Ontology, 中文名叫做基因本体论,采用GO terms描述基因产物的功能, 并且提供了不同GO terms 之间的关系。官网如下

​http://geneontology.org/​

GO定义的基因功能分成以下3大类别:

  1. molecular function
  2. cellular component
  3. biological process

所有GO term构成了一个有向无环图,示意图如下

Gene Ontology-基因产物功能数据库_官网

每个GO是图中的一个节点,GO之间的连线表示图中的边的信息。不同GO之间的箭头是有方向的,代表特殊含义的,所以构成的网状结构叫做有向无环图。

需要注意的是,GO之间的关系不是一个树状结构,首先BP,CC, MF 这3个节点是独立的,没有公共父节点的;其次,GO没有树状结构中严格的层级关系。所有也有父节点,子节点的概念,但是层级关系不明显,一个GO可以有多个父节点。

每个GO term用一个唯一的GO编号表示,前缀为GO, 后面是6位数字,比如​​GO:0015749​​。由于GO是基于已有的生物学知识构建的,而这些认知是不断修正和完善的,所有会存在有的GO term被删除了,或者是和其他GO Term合并的情况。

不同GO term之间的关系是多种多样的,以下只讨论几种常见的关系

  1. is a
  2. part of
  3. hast part
  4. regulation

​is a​​关系的示意图如下

Gene Ontology-基因产物功能数据库_官网_02

线粒体是细胞器的一种, 两者之间的关系是 线粒体​​is  a​​细胞器。

​part of​​关系的示意图如下

Gene Ontology-基因产物功能数据库_父节点_03

线粒体是细胞质的组成部分,二者之间的关系是线粒体​​part of​​细胞质。

​has part​​关系的示意图如下

Gene Ontology-基因产物功能数据库_映射关系_04

通常用于描述细胞内各种复合体之间的关系。

​regulation​​ 表示调控关系,示意图如下

Gene Ontology-基因产物功能数据库_官网_05
对于调控关系而言,有正调控和负调控两种。

所有GO Terms的信息可以通过以下链接进行下载

​http://www.geneontology.org/page/download-ontology​

Gene Ontology-基因产物功能数据库_官网_06

提供了​​obo​​​, ​​owl​​等格式,通常情况下,使用go-basic.obo 文件就就可以了。

GO本身是一个跨物种的概念,官方提供的GO文件涵盖了大部分的物种的所有功能。但是对于特定领域的物种来说,其功能只占整个GO的一部分,此时,可以从整个GO中抽取出对应的部分,构成一个子集,这个子集就叫做GO  Slim, 在以下链接中,提供了不同领域的GO Slim。

​http://www.geneontology.org/page/go-subset-guide​

Gene Ontology-基因产物功能数据库_父节点_07

对于特定的物种,采用合适的GO Slim, 可以有效减少后续数据挖掘的工作量。

在官网上, 还提供了部分物种的GO注释信息,链接如下

​http://www.geneontology.org/page/download-go-annotations​

Gene Ontology-基因产物功能数据库_父节点_08

除此之外,还提供了GO与其他数据库,比如KEGG Pathway, RDP, COG等数据库的映射关系,链接如下

​http://www.geneontology.org/page/download-mappings​

InterPro与GO的映射关系示例如下

InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:DNA binding ; GO:0003677
InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:steroid hormone receptor activity ; GO:0003707
InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:zinc ion binding ; GO:0008270
InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:regulation of transcription, DNA-templated ; GO:0006355
InterPro:IPR000003 Retinoid X receptor/HNF4 > GO:nucleus ; GO:0005634

扫描关注微信号,更多精彩内容等着你!

Gene Ontology-基因产物功能数据库_父节点_09