本地blast使用教程

一、 软件安装

1.下载地址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.11.0/

2.点击红框里的版本开始下载:

testbed支持语言 testbed安装步骤_testbed支持语言

3.安装步骤:

testbed支持语言 testbed安装步骤_生物学_02


testbed支持语言 testbed安装步骤_testbed支持语言_03

查看是否安装成功(可以不操作,直接跳到到配置环境变量):

① 找到自己安装的文件夹

testbed支持语言 testbed安装步骤_环境变量_04

② 将上图红框的位置改为cmd,然后回车进入命令提示符

testbed支持语言 testbed安装步骤_blast_05


testbed支持语言 testbed安装步骤_testbed支持语言_06

③ 在命令提示符输入blastn –version,然后回车

testbed支持语言 testbed安装步骤_环境变量_07

回车之后显示下图则证明安装成功

testbed支持语言 testbed安装步骤_blast_08

二、 配置环境变量

  1. 如图所示建立新文件夹命名为database
  2. testbed支持语言 testbed安装步骤_生物学_09

  3. 添加环境变量
    ① 右键上图database文件夹,点击属性,如下图,选择安全,然后复制红框内的路径
  4. testbed支持语言 testbed安装步骤_testbed支持语言_10

② 打开我的电脑,右击然后选择属性,点击高级系统设置,如下图:

testbed支持语言 testbed安装步骤_生物信息学_11

选择高级,点击环境变量

testbed支持语言 testbed安装步骤_环境变量_12

点击下图红框内的新建按钮

testbed支持语言 testbed安装步骤_blast_13

如下图,变量名输入blastdb(红框),变量值粘贴第①步复制的路径(蓝框),填完之后点击确定

testbed支持语言 testbed安装步骤_testbed支持语言_14

然后点击下图蓝框内的确定,就配置好环境变量了。

testbed支持语言 testbed安装步骤_testbed支持语言_15

注:配置环境变量的目的是让系统知道数据库的位置在哪里

三、 本地blast的使用

  1. 建立数据库
    ① 下载需要的基因组或cds序列文件(.fasta格式)

②下载完成后解压选择需要的序列文件(以中牧一号cds序列为例)

testbed支持语言 testbed安装步骤_生物学_16

② 复制上图红框内的文件粘贴到刚才新建的database文件夹中,如下图

testbed支持语言 testbed安装步骤_testbed支持语言_17

为了方便可以将名字改为zhongmuyihao_cds.fasta

testbed支持语言 testbed安装步骤_环境变量_18

③ 在database文件夹内,将下图红框位置改为cmd然后回车

testbed支持语言 testbed安装步骤_环境变量_19


testbed支持语言 testbed安装步骤_生物信息学_20

进入命令提示符,如下图

testbed支持语言 testbed安装步骤_生物学_21

输入:

makeblastdb -in zhongmuyihao_cds.fasta -parse_seqids -hash_index -dbtype nucl 然后回车

testbed支持语言 testbed安装步骤_环境变量_22

注意:黄色框框里输入的是序列库的名称,需要和我们粘贴到database文件夹里的名称一致;蓝色框框里只能写nucl或者prot,nucl代表核酸库,prot代表蛋白库,我们建立的cds序列库所以写nucl。

回车之后出现下图则证明建库成功:

testbed支持语言 testbed安装步骤_生物学_23

此时回到database文件夹发现多了很多其他格式的文件夹,如下图:

testbed支持语言 testbed安装步骤_生物学_24

  1. 进行序列比对
    ① 将我们需要比对的序列(.fasta格式)粘贴到如下位置:

② 像之前一样,在下图红框输入cmd并回车

testbed支持语言 testbed安装步骤_testbed支持语言_25

输入tblastn -query b.fasta -db zhongmuyihao_cds.fasta -out b.out -outfmt 7 -evalue 0.00001 然后回车,如下图:

testbed支持语言 testbed安装步骤_环境变量_26

注意:示例用的蛋白序列比对的核酸库,所以上图黄色框框里填写的是tblastn(其他规则见下图),蓝色框框里写的是需要比对的序列,和刚才粘贴的文件名一致,绿色框框里写的是我们建的序列库,上图用的是中牧一号的cds序列库,白色框框里写的是输出文件的名称,尽量与蓝框对应(如b.fasta对应b.out)。其他部分不需要变化。

testbed支持语言 testbed安装步骤_blast_27

然后返回下图文件夹,会生成.out文件:

testbed支持语言 testbed安装步骤_生物学_28

将.out文件转化为.xls(Excel文件)格式(重命名,将out改为xls)如下图:

testbed支持语言 testbed安装步骤_blast_29

点击 是

testbed支持语言 testbed安装步骤_生物学_30

然后打开.xls文件,如下图:

testbed支持语言 testbed安装步骤_环境变量_31

上图从左到右分别是:query acc.ver, subject acc.ver, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score,他们的含义如下图:

testbed支持语言 testbed安装步骤_testbed支持语言_32