谁知道怎样在NCBI中找数据库?

谁知道怎样在NCBI中找数据库?,第1张

NCBI 分类学数据库(taxonomy database)不是分类学或系统发育信息的信息源(primary source),而且也没有自己的一套完整的分类学系统,相反它只是努力整合各种各样来源的系统发育和分类学的知识,包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al., 2000)。

获取序列所对应的分类学信息有两种方法。

一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdump.zip 文件。文件解压缩后包括1 个*.prt 文件和6 个*.dmp 文件。Gencode.dmp 文件保存有不同的密码子表,与同目录的gc.prt 联合使用;merged.dmp 是保存有合并的taxid 号的对应表;nodes.dmp 是结点信息;division.dmp 是较大的几个分类;names.dmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用Http 或ftp 方式将文件下载到本地,通过本地程序或脚本搜索文本,来建立gi 号与Taxid 之间的联系(图)。这种方法比较适合于在线服务的Web 形式的程序,通过在本地不断地及时更新程序就可以完成这项工作。

第二种方法是对Taxonomy 数据库进行API 分析。NCBI 用来保存Taxonomy信息的数据库名称为TAXON。

Endnote

X2中左下角数据库栏,有个“PubMed(NLM)”

它里面提供远程的搜索,你用次库搜的结果一小部分是免费的。

是有些杂志为吸引读者继续读而故意免费的。

NCBI库很大,它不在Endnote

X2中,但是PubMed是NCBI中最大的一个免费量分支库。

换句话说,你用的PubMed搜的东西已经是NCBI免费的资料了。

楼主,切记,天下没有免费的午餐。。。。。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9416824.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存