我记得ensembl有个comparative genomics,可以找到不同物种同一个基因或是同系物或旁系物的序列,然后直接进行比对,找到保守区域,感觉跟题主的需求相似,就是需要看一下ensembl是否包含你感兴趣的那些细菌亚种的基因组数据
Ensembl
>
NCBI上可以查分子量,还有其它的方也可以查。我推荐几个吧:
Genecards: :>
我硕士读的是细胞生物学,今年4月开始在boss要求下自学perl,打听了下,<learning perl>这本书不错,就买来开始看,等5月份去北京参加公司的培训班时,<learning perl>读了一遍,<intermediate perl>看了一部分。培训回来,我们的项目就开始做了,9月拿到所有原始数据和分析结果。然后,我对照着公司的分析报告,试着自己走一边分析流程,中间遇到问题,自己解决不了的,就发邮件求助。有几点需要注意:1 我能理解你想早些玩儿数据的愿望,但是在这之前,最好要有一个outline需要知道数据从哪儿来的,怎么产生的?其实就是测序仪的工作原理。然后是数据质量检验,为什么需要数据过滤?接着是reads拼接和组装。总之,要对整个流程有一个认识,而后在学习的过程中,再不断回头对比这个流程,这样才不会有迷失的感觉。2 有了基础知识的铺垫,就可以尝试着自己做些练习了,paper上面都会给出他们的数据、原码地址,可以找来自己试试,先看看自己能不能做出一样的效果。当然,这时要是你手里正好有项目,那就更好了。3 学生物信息,paper肯定是要跟踪的。覆盖生物信息有趣的论文, 算法,以及生物科学问题。这个网站还汇集了很多生物信息领域科学家的博客。再如BGI的主程罗瑞邦, SAMtools、BWA的作者Heng Li都有在这里出现。[RNA-Seq Blog](RNA-Seq Blog) 推荐新的论文、工作、培训课程、大型会议等。如果你是生物背景的,那么计算机方面的知识需要补一下:需要能在linux环境下舒服的工作。比如从源码编译安装软件PATH配置,再比如舒服地使用google找到问题的答案。学会使用python/perl。比如有的时候运行一个软件老是报错,可能就是因为在一个包含几十万行的文本文件里,有随机的那么几千行的末个位置,多一个冒号, 这时候你知道需要怎么做了? 学会R。要从一大堆基因里面找出表达水平变化的基因来,需要统计分析和显著检验;而要把我们的数据更直观地展示出来,最好的方式就是图形了吧。这两个需要,R都能满足。当然matlab也是可以的,区别在于R是开源工具。具备了上述技能,那么常用的软件就能用起来了。随着学习的深入,可能你的问题别人也没遇到过,这时候就需要自己动手,要么修改现成的工具,要么自己做一个出来。这时候,除了python/perl,或许还可以学C/C++/java,或许需要研究下比如BWT、De Bruijn Graph背后的原理。
IARS2-003指isoleucyl-tRNA synthetase 2基因003转录本。
ENST00000490891是IARS2-003的transcript ID,OTTHUMT00000090763是另一个数据库对同一转录本的编号(Havana transcript)。
>
以上就是关于怎么在EBI数据库上批量下载搜索到的某个菌的不同亚种的某个基因的序列全部的内容,包括:怎么在EBI数据库上批量下载搜索到的某个菌的不同亚种的某个基因的序列、使用Ensembl查找基因启动子序列、蛋白质分子量在什么数据库查等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)