入门的、基础的,对高手来讲根本不是个问题。但新手就不同了。
当然了,直到现在,虽说已经会了一些,但在NCBI 查找基因,虽说是基础但也是挺复杂的
今天要讲的。
今天用“苯丙氨酸解氨酶(Phenylalanine ammonia-lyase,PAL)”来作为例子,物种是豆科的。
1,打开NCBI,选择核苷酸(Nucleotide)数据库,填上Phenylalanine ammonia-lyase,
点击GO,搜索
2,我们来看结果,总共有1022 个,结果太多了,有时候刚好你要的结果在第一页的话,
那就好办。不是的话,你慢慢的找,实在不是办法。特别是网络不好时,上NCBI 又很慢,
的确是一种折磨。
3,这个时候我们可以再想办法缩少范围,比方你要找的是豆科的,我们来大豆(soybean)
来作例子。在搜索时加上soybean,结果将会大大减少。
4,这时候结果已经一目了然,这里需要再介绍另外一种搜索的方法。这种方法是比较精确
的。首先在taxonomy 数据库查到soybean 的 taxonomy ID,再回到Nucleotide 数据库,
搜索” Phenylalanine ammonia-lyase txid3847 “,txid 是taxonomy ID 是缩写,3847 是大豆
soybean 的taxonomy ID。这样子,将搜索范围锁定在大豆。
5,看下图,出来的结果都是大豆的,这时基本上就大功告成了。找到了大豆苯丙氨酸解氨酶的序列
6,进入序列页面,默认是GenBank 格式,你也可以选择Fasta 格式,一般都是保存为Fasta格式。
三大核酸数据库的特点分别是:1、Genome收录的物种涉及所有的生物领域:细菌、古细菌、真核生物,以及许多病毒、噬菌体、类病毒、质粒以及含有遗传物质的细胞器。
2、Gene数据库收录全部已测序物种的基因注释信息,包括基因的名称、染色体定位、基因序列和编码产物(mRNA、蛋白质)情况、基因功能和相关文献信息等,并与GenBank、OMIM、遗传多态数据库(如dbSNP、dbVar)等NCBI子库,及KEGG、GeneOntology等外源性数据库进行交叉引用。
3、GenBank是NIH遗传序列数据库,集成了所有公开可获得的已注释DNA序列,其收录的核酸序列数据根据不同的研究属性,分属于Nucleotide、GSS和EST三个子库。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)