本地BLAST序列比对
本人已委托维权骑士( http://www. rightknights.com )进行原创维权。
思想高屋建瓴,知识原创共享。
转载请引用链接。
一.本地BLAST:
- 定 义:本地BLAST是NCBI向用户提供的在计算机本地,对核酸、蛋白序列进行局部比对的算法工具
- 优缺点:本地BLAST具有可自建比对库、定义输出信息格式、无需连接网络等优点,但需要输入命令行,不如在线BLAST便捷
二.工具介绍:
在官网下载相应版本安装至自定义目录,在目录下的bin文件夹中就可以看到本地BLAST的各个工具:
- blastn: 核酸序列比对
- blastp: 蛋白质序列比对
- blastx: 核酸翻译成蛋白质序列,再与蛋白质序列库比对
- tblastn:核酸序列库翻译成蛋白质序列库,再与蛋白质序列比对
- tblastx:核酸与核酸序列库都翻译为蛋白质序列,再在蛋白质水平上比对
- makeblastdb:建立自定义的比对序列库
三.使用工具:
(一)建立比对序列库(也可以下载库):
运行中输入CMD进入命令行(或在安装目录下进入PowerShell)输入以下命令:
安装路径\bin\makeblastdb -in 建库序列文件名.fasta -dbtype nucl -out database
分别对应:工具 -in 用于建库的序列文件(fasta格式) -dbtype 数据库类型 -out 数据库名
(二)序列和库的局部比对:
安装路径\bin\blastn(或前面介绍的其他比对工具) -query 比对序列文件名.fasta -db database -out 比对结果文件名 -evalue le-5 -outfmt 0(或其他比对结果参数)
分别对应:工具 -query 比对序列文件(fasta格式) -db 数据库名 -out 比对结果文件名 -evalue 期望值(默认为10,一般设置le-5) -outfmt 比对结果参数
(三)比对结果的输出参数:0-18,常用0,5,6,7
- 0:成对输出,与在线比对结果相同
- 5:输出XML格式
- 6:输出table格式
- 7:输出带有注释行的table格式,有以下参数可通过’’7 参数’’的形式接在-outfmt后使用:
- qacc:查询基因的序列号
- sacc:库基因的序列号
- qstart:查询基因的匹配开始位置
- sstart:库基因的匹配开始位置
- qend:查询基因的匹配结束位置
- send:库基因的匹配结束位置
- qseq:查询基因的匹配序列
- sseq:库基因的匹配序列
- evalue:期望值
- bitscore:比特得分还是每对得分?(这个没用过)
- score:原始得分
- length:对齐长度
- pident:相同匹配百分比
- nident:相同匹配数量
- mismatch:不匹配数量
- gaps:间隙数
- gapopen:间隙开口数
- positive:积极得分的个数
- ppos:积极得分的百分比