NCBI的blastn 引物比对与ACCESSION的问题

NCBI的blastn 引物比对与ACCESSION的问题,第1张

同意楼上的,刚刚测试了下。
在organism处限定物种即可:Klebsiella pneumoniae。然后你只需页面搜索就能定位到你的序列
若不限定物种,因为高度同源的序列很多,或者说符合输出条件的数量超过了NCBI反馈序列数量最大值(100条最优结果),多出的序列就被舍弃了,而你的目的序列恰在100以后。

分类: 教育/科学 >> 学习帮助
问题描述:

可否介绍一下ncbi中blast的用法,详细点

要中文的,重点是序列对比部分,结果分析也给个说明

Thanks

解析:

先到:
1301429110/BLAST/indexs
选择

Nucleotide-nucleotide BLAST (blastn)

然后在Search旁边那个大方框里填你要寻找的序列,然后点

BLAST!

然后按

Format!

这时会d出一个新的窗口,慢慢等个十几秒几十秒……出来的结果会将找到的序列按是否接近排列出来点最左边一栏(例:gi||ref|XR_0253881|)的话会给你看找到的序列的详细介绍,而如果点Score bits下面的数字就可以看见你输入的序列和他们在数据库找到的序列的对比。上面Query一行是你输入的,下面Sbjct是数据库里的序列。

BLAST包含五 个程序和若干个相应的数据库,分别针对不同的查询序列和要搜索的数据库类型。其中翻译的核酸库指搜索比对时会把核酸数据按密码子按所有可能的阅读框架转换成蛋白质序列。

BLAST对序列格式的要求是常见的FASTA格式。FASTA 格式第一行是描述行,第一个字符必须是“>”字符;随后的行是序列本身,一般每行序列不要超过80个字符,回车符不会影响程序对序列连续性的看法。 序列由标准的IUB/IUPAC氨基酸和核酸代码代表;小写字符会全部转换成大写;单个“-”号代表不明长度的空位;在氨基酸序列里允许出现“U”和 “”号;任何数字都应该被去掉或换成字母(如,不明核酸用“N”,不明氨基酸用 “X”)。此外,对于核酸序列,除了A、C、G、T、U分别代表各种核酸之外,R代表G或A(嘌呤);Y代表T或C(嘧啶);K代表G或T(带酮基);M 代表A或C(带氨基);S代表G或C(强);W代表A或T(弱);B代表G、T或C;D代表G、A或T;H代表A、C或T;V代表G、C或A;N代表A、 G、C、T中任意一种。对于氨基酸序列,除了20种常见氨基酸的标准单字符标识之外,B代表Asp或Asn;U代表硒代半胱氨酸;Z代表Glu或Gln; X代表任意氨基酸;“”代表翻译结束标志。

BLASTp:用蛋白质序列搜索蛋白质序列库

BLASTn:用核酸序列搜索核酸库

BLASTx:核酸序列对蛋白质库的比对,核酸序列在比对之前自动按照六个读码框翻译成蛋白质序列

tBLASTn:蛋白质序列对核酸库的比对,核酸库中的序列按照六个读码框翻译后与蛋白质序列进行比对搜索

tBLASTx:核酸序列对核酸库在蛋白质质级别的比对,两者都在搜索之前翻译成为蛋白质质进行比对


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13434683.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-05
下一篇 2023-08-05

发表评论

登录后才能评论

评论列表(0条)

保存