如何利用NCBI数据库进行基因多态性分析_sql

在NCBI 上查找基因，挺多人都在问这个。当然，对于经常泡NCBI 的人来说，查找基因是

入门的、基础的，对高手来讲根本不是个问题。但新手就不同了。

当然了，直到现在，虽说已经会了一些，但在NCBI 查找基因，虽说是基础但也是挺复杂的

今天要讲的。

今天用“苯丙氨酸解氨酶(Phenylalanine ammonia-lyase，PAL)”来作为例子，物种是豆科的。

1，打开NCBI，选择核苷酸（Nucleotide）数据库，填上Phenylalanine ammonia-lyase，

点击GO，搜索

2，我们来看结果，总共有1022 个，结果太多了，有时候刚好你要的结果在第一页的话，

那就好办。不是的话，你慢慢的找，实在不是办法。特别是网络不好时，上NCBI 又很慢，

的确是一种折磨。

3，这个时候我们可以再想办法缩少范围，比方你要找的是豆科的，我们来大豆（soybean）

来作例子。在搜索时加上soybean，结果将会大大减少。

4，这时候结果已经一目了然，这里需要再介绍另外一种搜索的方法。这种方法是比较精确

的。首先在taxonomy 数据库查到soybean 的 taxonomy ID，再回到Nucleotide 数据库，

搜索” Phenylalanine ammonia-lyase txid3847 “，txid 是taxonomy ID 是缩写，3847 是大豆

soybean 的taxonomy ID。这样子，将搜索范围锁定在大豆。

5，看下图，出来的结果都是大豆的，这时基本上就大功告成了。找到了大豆苯丙氨酸解氨酶的序列

6，进入序列页面，默认是GenBank 格式，你也可以选择Fasta 格式，一般都是保存为Fasta格式。

三大核酸数据库的特点分别是：

1、Genome收录的物种涉及所有的生物领域：细菌、古细菌、真核生物，以及许多病毒、噬菌体、类病毒、质粒以及含有遗传物质的细胞器。

2、Gene数据库收录全部已测序物种的基因注释信息，包括基因的名称、染色体定位、基因序列和编码产物（mRNA、蛋白质）情况、基因功能和相关文献信息等，并与GenBank、OMIM、遗传多态数据库（如dbSNP、dbVar）等NCBI子库，及KEGG、GeneOntology等外源性数据库进行交叉引用。

3、GenBank是NIH遗传序列数据库，集成了所有公开可获得的已注释DNA序列，其收录的核酸序列数据根据不同的研究属性，分属于Nucleotide、GSS和EST三个子库。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10027020.html

如何利用NCBI数据库进行基因多态性分析

发表评论

评论列表（0条）