megablast如何使用

megablast如何使用,第1张

MEGABLAST常被用于鉴定核酸序列MEGABLASTisthetoolofchoicetoidentifyanucleotidesequence.MegaBLAST也是一种BLASTN程序。

MegaBlast是经典比对软件Blast的一个子模块,在现版本的Blast+中隶属于blastn的一个子模块(task)。blastn是用于核酸序列比对的一个模块,MegaBlast执行同样的功能,但是它可以跑得更快。

MegaBlast使用的database依然是正常的,用makeblastdb建立的database文件,但是我们还可以对database再建立一个MegaBlast专用的index。

1.cmd中执行

cd C:\blast-2.9.0+\bin 变为在bin中执行

2.建库

C:\blast-2.9.0+\bin>makeblastdb.exe -in name.fa -dbtype prot -out name.db

3.比对

C:\blast-2.9.0+\bin>blastp.exe -query name.fa -out blast.out.txt -db name.db -evalue 1e-10 -outfmt 6

1、Global alignments 全局比对:尽可能保证两条序列的碱基都能配对,因此会有比较多的错配和gap,但是不会对序列两端对gap进行罚分。

2、Local alignments 局部比对:尽可能的找到能最优匹配对子区域。

3、多序列比对:常用的软件为: mafft, muscle, clusta-omega, t-coffee等,是全局比对。

4、BLAST (Basic Local Alignment Search Tool),结果是局部比对。Its purpose is to search a large body of known information for similarities (hits).

5、如何使用blast

1⃣️ Prepare a BLAST database with makeblastdb.  This only needs to be done once.

2⃣️Pick a blast tool-- blastn\blastp\blastx\tblastn\tblastx , as appropriate (use -h to see and chose the parameters).

3⃣️Run the tool and format the output as needed ( -outfmt 6 or 7 to format the outputs into tabular or even add custom fields to the output).

4⃣️如果只有两条序列,则不需要构建database,blastn可以直接进行pairwise alignment,命令如下:blastn -query query.fa -subject ~/refs/ebola/KM233118.fa

5⃣️ blastn -task 选项可以选择多种模式:

                blastn - finds more divergent sequences;megablast - finds less divergenent sequences;blastn-short - short queries 

6⃣️blast 会自动过滤掉一些低复杂度的序列(高度重复)使用 -dust no 关闭过滤。

6、blast databases

1⃣️现成的databases:ftp://ftp.ncbi.nlm.nih.gov/blast/db/

2⃣️

3⃣️blastdbcmd :queries blast databases. -info

        List the content of the blast database:blastdbcmd -db index/all -entry 'all' -outfmt "%a"

4⃣️elink : to see which publication links to this sequence?

        esearch -db nuccore -query NR_118889.1 | elink -target pubmed | efetch

5⃣️reformat database

        blastdbcmd -db ~/refs/refseq/16SMicrobial -entry 'all' -outfmt '%a,%l,%T,%L' | tr ','  '\t' 

6⃣️extract a specific entry

        Get the first 20 bases of a specific 16S gene:blastdbcmd -db  ~/refs/refseq/16SMicrobial -entry 'NR_118889.1' -range 1-20

7、extractfeat


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11841169.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-19
下一篇 2023-05-19

发表评论

登录后才能评论

评论列表(0条)

保存