首发于 生物信息

本地BLAST序列比对

本人已委托维权骑士( rightknights.com )进行原创维权。

思想高屋建瓴,知识原创共享。

转载请引用链接。


一.本地BLAST:

  • 定 义:本地BLAST是NCBI向用户提供的在计算机本地,对核酸、蛋白序列进行局部比对的算法工具
  • 优缺点:本地BLAST具有可自建比对库、定义输出信息格式、无需连接网络等优点,但需要输入命令行,不如在线BLAST便捷

二.工具介绍:

在官网下载相应版本安装至自定义目录,在目录下的bin文件夹中就可以看到本地BLAST的各个工具:

  1. blastn: 核酸序列比对
  2. blastp: 蛋白质序列比对
  3. blastx: 核酸翻译成蛋白质序列,再与蛋白质序列库比对
  4. tblastn:核酸序列库翻译成蛋白质序列库,再与蛋白质序列比对
  5. tblastx:核酸与核酸序列库都翻译为蛋白质序列,再在蛋白质水平上比对
  6. makeblastdb:建立自定义的比对序列库

三.使用工具:

(一)建立比对序列库(也可以下载库):

运行中输入CMD进入命令行(或在安装目录下进入PowerShell)输入以下命令:

安装路径\bin\makeblastdb -in 建库序列文件名.fasta -dbtype nucl -out database

分别对应:工具 -in 用于建库的序列文件(fasta格式) -dbtype 数据库类型 -out 数据库名

(二)序列和库的局部比对:

安装路径\bin\blastn(或前面介绍的其他比对工具) -query 比对序列文件名.fasta -db database -out 比对结果文件名 -evalue le-5 -outfmt 0(或其他比对结果参数)

分别对应:工具 -query 比对序列文件(fasta格式) -db 数据库名 -out 比对结果文件名 -evalue 期望值(默认为10,一般设置le-5) -outfmt 比对结果参数

(三)比对结果的输出参数:0-18,常用0,5,6,7

  • 0:成对输出,与在线比对结果相同
  • 5:输出XML格式
  • 6:输出table格式
  • 7:输出带有注释行的table格式,有以下参数可通过’’7 参数’’的形式接在-outfmt后使用:
  1. qacc:查询基因的序列号
  2. sacc:库基因的序列号
  3. qstart:查询基因的匹配开始位置
  4. sstart:库基因的匹配开始位置
  5. qend:查询基因的匹配结束位置
  6. send:库基因的匹配结束位置
  7. qseq:查询基因的匹配序列
  8. sseq:库基因的匹配序列
  9. evalue:期望值
  10. bitscore:比特得分还是每对得分?(这个没用过)
  11. score:原始得分
  12. length:对齐长度
  13. pident:相同匹配百分比
  14. nident:相同匹配数量
  15. mismatch:不匹配数量
  16. gaps:间隙数
  17. gapopen:间隙开口数
  18. positive:积极得分的个数
  19. ppos:积极得分的百分比

编辑于 2021-12-10 16:47

文章被以下专栏收录