●STRING数据库介绍 ●
做科研的时候,为了研究蛋白之间的相互作用网络,我们需要借助一些蛋白质相互作用数据库,而string(Search Tool for the Retrieval of Interaction Gene/Proteins)绝对是其中覆盖的物种最多,相互作用信息最大的数据库。
string首页
String数据库(https://string-db.org/)是一个搜寻蛋白质之间相互作用的数据库。既包括蛋白质之间的直接物理相互作用,也包括蛋白质之间的间接功能相关性,数据库目前已经更新到Version 11.0b,应用范围2090个物种,包含24'584'628种蛋白和3'123'056'667个蛋白质之间的相互作用,目前这一数据还在更新中。它除了包含有实验数据、从PubMed摘要中挖掘的结果和综合其他数据库数据外,还有利用生物信息学的方法预测的结果。
下面进行STRING数据库各功能使用演练。
- 已知单个基因查找互作网络
首先,通过浏览器进入STRING数据库,点击中间的SEARCH,进入搜索页面如下:
它可以选择不同方式去查找互作网络,可通过输入单个或者多个蛋白名称、氨基酸序列)查找其互作网络。如果我们有一个目标蛋白,想要查看这个蛋白的可能的相互作用蛋白可以选择Protein by name;如果我们有很多蛋白,想要查看这些蛋白之间的相互作用关系,那就可以选择Multiple proteins。
这次我们选择随机进入:这里就以ZDHHC1为例,查找一下它的互作网络。Protein Name这里输入ZDHHC1,(选择“auto-detect”后,会自动匹配出最合适的物种),点SEARCH按钮,下一页面点击CONTINUM很快就得到结果。
在Viewers为Network模式下,彩色的“小球 “(或称为节点,Node)表示具直接作用的蛋白,“球 “之间的不同颜色样式的连线(或称为边,edge)表示不同的作用类型。
得到相关的蛋白互作网络图:
点击图中的“玻璃球“可以查看蛋白质相关信息,空的”玻璃球“表示暂无该蛋白的3D结构(上图只有1个是没有的)。
圆圈节点之间的直线(edge)代表该直线连接的两个蛋白之间的相互作用关系。点击直线可查看详细信息,不同颜色对应不同的相互作用类型。因为STRING数据库中edge的来源主要包含七部分,即实验数据、文本挖掘数据、数据库数据,基因邻接、基因融合、基因共表达。该系统利用一个打分机制对这些不同方法得来的结果给予一定的权重,最终给出一个综合得分。其实,我们也可以根据自己的需求,设置自己感兴趣的作用类型。
还可以查看他们其他图片的表达形式:
基因共现图
基因共表达图
最终的呈现图案,可以通过选择“exports”,下面多个条目进行选择。可导出(download)两种格式(png和svg)的网络图(如下图),若果觉得这里的“玻璃球“比较丑,也可以表格的形式导出文本文件(tsv格式)。
另外,在Analysis列表,除了给出互作网络的相关信息,还给出了相应的GO和KEGG富集分析结果,需要的话也可以将分析结果下载下来)。
2.基因集(蛋白集)间的互作关系
回到分析主界面,选择Multiple proteins如下图所示,填上基因集,(也可以填基因集文件)然后搜索就可以得到多基因蛋白之间的互作关系了,非常方便又好操作。
3.下载物种对应数据
STRING数据库提供了下载功能,由于整个数据库非常大,所以可以选择一个物种,然后下载该物种对应的数据,示意如下:
好了,STRING数据库看起来很高端,有其强大的可视化,以及自定义功能,但是使用起来还是很简单的,今天就介绍到这里,更多的使用细节可以参见数据库说明。