在NCBI中,如何获取一个物种的所有蛋白质序列和二级结构

在NCBI中,如何获取一个物种的所有蛋白质序列和二级结构,第1张

我可以告诉你,那是不可以能的。一个物种所包含的蛋白质有多少种?NCBI中储存的数据是按照单个蛋白质序列贮存的,而且都只是序列,NCBI不是二级结构数据库,要找二级结构去PDB找,在说了,就算你找到了所有的某个物种的所有蛋白质序列,您也基本上不可能找到所有对应的二级结构,因为PDB中已经测定的二级结构于NCBI已经测序的序列,那简直就相差太多了。二级结构目前已经准确则需的大概13W中蛋白质,而NCBI中的序列数据的一个月增长速度也许都要比这个高。所以LZ所说的基本上是不可能的,主要是二级结构

网址中输入NCBI,点开NCBI主页。。在主页的右上方有可选框,选择protein,后面输入蛋白名称,如果想具体找到的话,直接输入物种加蛋白,回车即可。

1、打开NCBI主页。

2、左边search里面选择GENE 右边的对话框里输入你想要的基因名称。

3、 在出来的所有条目第一行后面都有种属表明,比如Homo sapiens是人Felis catus是猫。选择你想要的种属。

4、再出现的页面中找到那个像数轴的图,在左侧有可以点击的蓝色数字,往往开头有AK、NM的开头,点击它,再出现的下拉框里选择GENEBANK。

5、最下面就是他的基因序列 当然也可以参考页面上提供的CDS区域范围来看。

注意事项

NCBI (National Center for Biotechnology Information)是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。

阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。

如果该基因编码的蛋白质在PDB数据库里有ID,基因注释里要有PDB id的。基因名字中一般不能用PDB数据库编号的,基因名字有自己通用的命名法则,可以和蛋白质名字类似或大小写的区别。

所以,NCBI数据库中的基因名字一般情况下不可以是蛋白质的PDBID。

基因是基因,蛋白质是蛋白质,基因名字和蛋白质名字不是一回事。NCBI数据库是一个超级大的数据仓库,里面有蛋白质数据库、蛋白质结构数据库、基因序列数据库、基因组序列数据库、蛋白质表达及基因芯片数据库等等,种类非常多。

到NCBI官网,数据库选择protein,输入蛋白质名称,然后再结果里找物种为human的结果,拿到这个序列到NCBI的Blast里比对,程序选择Blastp,比对结果中肯定至少有一个是小鼠同源蛋白。或者直接用clustalX把human,mice的蛋白序列直接比较。

我查询了NCBI数据库,在核酸数据库(Genbank)中确实没有查询结果,但是其他数据库是有结果的,例如蛋白质数据库中。

我想你是知道的,胰高血糖素是胰高血糖素经过酶切的产物,也就是说都是“翻译后”的发生的事情。

回过头了,我们来说NCBI。NCBI的核酸序列都是生物学家通过测序获得的,要么是基因组序列,要么是转录组序列。所有序列都是以基因名为主要检索词

因此,如果你用基因名称GCG或glucogen检索就可以检索到你想要的结果。参考资料中是gene database的链接。

看一下这个链接

>

以上就是关于在NCBI中,如何获取一个物种的所有蛋白质序列和二级结构全部的内容,包括:在NCBI中,如何获取一个物种的所有蛋白质序列和二级结构、怎么查找一个蛋白质的基因组序列、NCBI中由基因名字可以有蛋白的PDBID 吗等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10171282.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存