如何利用NCBI数据库进行基因多态性分析

如何利用NCBI数据库进行基因多态性分析,第1张

在NCBI 上查找基因,挺多人都在问这个。当然,对于经常泡NCBI 的人来说,查找基因是

入门的、基础的,对高手来讲根本不是个问题。但新手就不同了。

当然了,直到现在,虽说已经会了一些,但在NCBI 查找基因,虽说是基础但也是挺复杂的

今天要讲的。

今天用“苯丙氨酸解氨酶(Phenylalanine ammonia-lyase,PAL)”来作为例子,物种是豆科的。

1,打开NCBI,选择核苷酸(Nucleotide)数据库,填上Phenylalanine ammonia-lyase,

点击GO,搜索

2,我们来看结果,总共有1022 个,结果太多了,有时候刚好你要的结果在第一页的话,

那就好办。不是的话,你慢慢的找,实在不是办法。特别是网络不好时,上NCBI 又很慢,

的确是一种折磨。

3,这个时候我们可以再想办法缩少范围,比方你要找的是豆科的,我们来大豆(soybean)

来作例子。在搜索时加上soybean,结果将会大大减少。

4,这时候结果已经一目了然,这里需要再介绍另外一种搜索的方法。这种方法是比较精确

的。首先在taxonomy 数据库查到soybean 的 taxonomy ID,再回到Nucleotide 数据库,

搜索” Phenylalanine ammonia-lyase txid3847 “,txid 是taxonomy ID 是缩写,3847 是大豆

soybean 的taxonomy ID。这样子,将搜索范围锁定在大豆。

5,看下图,出来的结果都是大豆的,这时基本上就大功告成了。找到了大豆苯丙氨酸解氨酶的序列

6,进入序列页面,默认是GenBank 格式,你也可以选择Fasta 格式,一般都是保存为Fasta格式。

三大核酸数据库的特点分别是:

1、Genome收录的物种涉及所有的生物领域:细菌、古细菌、真核生物,以及许多病毒、噬菌体、类病毒、质粒以及含有遗传物质的细胞器。

2、Gene数据库收录全部已测序物种的基因注释信息,包括基因的名称、染色体定位、基因序列和编码产物(mRNA、蛋白质)情况、基因功能和相关文献信息等,并与GenBank、OMIM、遗传多态数据库(如dbSNP、dbVar)等NCBI子库,及KEGG、GeneOntology等外源性数据库进行交叉引用。

3、GenBank是NIH遗传序列数据库,集成了所有公开可获得的已注释DNA序列,其收录的核酸序列数据根据不同的研究属性,分属于Nucleotide、GSS和EST三个子库。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/10865207.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-11
下一篇 2023-05-11

发表评论

登录后才能评论

评论列表(0条)

保存