我都是根据 Query coverage ,其实排在前面的几个要么就是你Blast的那个核苷酸序列,要么是这个序列的全长或染色体上的DNA序列。你看看前几个位置的Description,就可以确定你的菌属于哪一个了。
NCBI NCBI下有很多数据库,以下是蛋白质序列
PopSet包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。
Entrez 功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。
BLAST(Basic Local Alignment Search Tool)是用于序列相似性检索的一个重要数据库,是区分基因和基因特征的工具。该软件能在15秒内完成整个DNA数据库的序列检索。BLAST记录的相关度有明确的统计学解释,以便更容易地将相关记录与随机的数据库记录相区分。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。
BLAST 主页提供了几种BLAST检索软件。其中BLAST20是一种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST 和PSI-BLAST两种软件的新功能。Gapped BLAST 允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。
Dnastar 可以用于解决你踢完的后半个问题
一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤:
打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。
二、结果:
输出序列长度918bp,
载体序列的区域456bp——854bp
克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的。
进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择
Annotation File :RM2sequpload_1287631711outhtml
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤:
进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!
二、结果:
CpG岛的长度:385bp
区域:48——432;
GC数量:Sum C+G=297,百分数=7714
Obs/Exp:101
4、预测下面序列的启动子,输出可能的启动子序列及相应的位置。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!
二、结果:
位置:711—761 ,1388—1438,1755—1805;
5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Splice Site Prediction,进入主页,复制序列。Organism选择Human or other。其他默认,运行!
二、结果:
供体:
受体:
6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是Zea的
进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。复制序列,默认,运行!
二、结果:ORF图
三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!
四、结果:
G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。
一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!
在MboI中选择第一个,EcoI选择第二个。
二、结果:
ENSCAN图
8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。
二、结果:
GC含量:
引物的位点:
Tm值:
产物长度:。
9、将下面的序列用NEBcutter 20工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求14% agarose和Marker为100bp DNA Ladder。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。
进入google首页,搜索NEBcutter 20,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。View gel。选择14% agarose和Marker为100bp。
二、结果:
然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物
NCBI((>
BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序),
S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。
E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
1、首先输入基因的完整学名,找到与基因相关的cDNA序列在这一cRNA序列的解说信息里,就已经有各外显子的分节
2、将该cDNA输入Blast进行序列比对,就可以找到其每一个外显子所对应的染色体位置,这些信息就显示了所有的外显子处于外显子两端的序列就是内含子
3、如你需要完整的基因序列,需要在blast中选择others这个数据库,然后查找相关的Bac质粒中含有你完整基因的文件,在其中找到你所需的信息
你进了NCBI的blast页面之后,粘贴进去序列,下面的program selection 选择第三个。结果中有一个“Gallus gallus”,即是家鸡了(应该是从上面数第二个结果)。
研究中通常使用blast来寻找蛋白质和基因。
在研究中,BLAST搜索是研究一个蛋白质或基因的最基本的方法之一。BLAST(Basic Local Alignment Search Tool)基本的局部相似性比对搜索工具。是用来将一个蛋白质或DNA序列和各种数据库中的其他序列进行比对的主要工具 (Altschul,1990,1997)。
BLAST检索第一次被提出是在Stephen Altschul,David Lipman及同事的一篇经典文献(1990)中。这篇论文描述了BLAST检索的理论基础以及一些基本问题,例如灵敏度(正确度)和速度。晚些时候有对BLAST算法的重要修饰,包括间隔BLAST的引入。
BLAST的主要功能
1、BLAST可以确定特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列。
2、BLAST可以确定哪些蛋白质和基因在特定的物种中出现。
3、BLAST可以确定一个DNA或蛋白质序列身份。
4、BLAST可以发现新基因。
5、BLAST可以确定一个特定基因或者蛋白质有哪些已经被发现了的变种。
6、BLAST可以研究可能存在多种剪接方式的表达序列标签。
7、BLAST可以寻找对于一个蛋白质的功能和/或结构起关键作用的氨基酸残基。
以上就是关于经转录组数据库blast的score和e值是什么意思全部的内容,包括:经转录组数据库blast的score和e值是什么意思、如何在酵母数据库中通过蛋白序列blast得到氨基酸序列、列举常用的生物信息学数据库及序列对比常用软件及特点等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)