谁知道怎样在NCBI中找数据库？_sql

NCBI 分类学数据库（taxonomy database）不是分类学或系统发育信息的信息源（primary source），而且也没有自己的一套完整的分类学系统，相反它只是努力整合各种各样来源的系统发育和分类学的知识，包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”（Wheeler et al., 2000）。

获取序列所对应的分类学信息有两种方法。

一种方法，从NCBI 网站下载gi与taxid 对应表，在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件，其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。这两个文件都只有两列，左边为gi 号，右边为Taxid。由于这些文件非常大，因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移，这两个文件会越来越大，不过速度不会是指数增长的，并且在美国东部时间的每个星期一2：00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdump.zip 文件。文件解压缩后包括1 个*.prt 文件和6 个*.dmp 文件。Gencode.dmp 文件保存有不同的密码子表，与同目录的gc.prt 联合使用；merged.dmp 是保存有合并的taxid 号的对应表；nodes.dmp 是结点信息；division.dmp 是较大的几个分类；names.dmp 结点名称信息，每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用Http 或ftp 方式将文件下载到本地，通过本地程序或脚本搜索文本，来建立gi 号与Taxid 之间的联系（图）。这种方法比较适合于在线服务的Web 形式的程序，通过在本地不断地及时更新程序就可以完成这项工作。

第二种方法是对Taxonomy 数据库进行API 分析。NCBI 用来保存Taxonomy信息的数据库名称为TAXON。

Endnote

X2中左下角数据库栏，有个“PubMed(NLM)”

它里面提供远程的搜索，你用次库搜的结果一小部分是免费的。

是有些杂志为吸引读者继续读而故意免费的。

NCBI库很大，它不在Endnote

X2中，但是PubMed是NCBI中最大的一个免费量分支库。

换句话说，你用的PubMed搜的东西已经是NCBI免费的资料了。

楼主，切记，天下没有免费的午餐。。。。。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9416824.html

谁知道怎样在NCBI中找数据库？

发表评论

评论列表（0条）