ncbi，embl和什么并称三大数据库_工具

DDBJ:DNA Data Base of Japan 是日本人建立的核酸数据库；

NCBI中的Genbank是美国建立的核酸数据库；

EMBL是欧洲建里的核酸数据库；

这三个数据库是连通的，数据共享。

1、打开NCBIgene数据库（>

这个问题涉及到NCBI的核心价值——数据共享。从NCBI创建之初她就是为用户”下载“数据而存在。历经近30年的发展，其提供的数据共享的方式也经历了诸多的改变。下面以提供数据共享的技术方式来逐一陈述：

1 FTP

FTP是File Transfer Protocol(文件传输协议)的英文简称。在互联网形成之初，非常重要的大文件传输格式。目前NCBI的大文件传输，甚至是整个NCBI网站的数据都可以用这种方式获得。网址为ftp://ftpncbinlmnihgov/不过要用好这些数据，你需要同时兼备生物学和计算机科学（基本）知识。

2 网页

当然绝大多数生物学家并不需要进行批量数据分析，知识要找到与自己课题相关的数据。NCBI提供了基于网页的查询检索系统。之所以称之为系统是因为其中包含了NCBI所有提供服务的数据库，该系统有一个统一的查询界面，成为Entrez。其语法和规则在查询不同数据库是基本相似，知识需要简单了解相应数据库的特殊字符即可。例如，查询GEO数据库时，只查询dataset数据可以使用[DataSet Type]关键字，但是该关键字在PUBMED并不适用。

3web服务

web服务在生物信息学和计算机科学中的定义有很大差别，这里特制计算机科学中的web服务。NCBI基于entrez提供了web service服务，用户在自己的程序中调用代码获取数据。主要是eUtils（>

电子文献载体类型标识：

DB/OL—联机网上数据库 DB/MT—磁带数据库 M/CD—光盘图书

CP/DK—磁盘软件 J/OL—网上期刊 EB/OL—网上电子广告

电子文献的著录格式：

[序号]主要责任者电子文献题名[电子文献类型标识/载体类型标识]电子文献的出处或可获得的地址，发表或更新日期/引用日期(任选)。

NCBI (National Center for Biotechnology Information[1] ）是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表，出现了生命过程的语法，其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性，并且为研究人员提供更好的便利来获得分析和计算的工具，以便推动对我们遗传之物和其在健康和疾病中角色的理解。

后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性，发起了在1988年11月4日建立国立生物技术信息中心（NCBI）的立法。NCBI是在NIH的国立医学图书馆（NLM）的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的，而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。

NCBI有一个多学科的研究小组包括计算机科学家，分子生物学家，数学家，生物化学家，实验物理学家，和结构生物学家，集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献，而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织，序列的分析，和结构的预测。目前研究计划的一些代表是：检测和分析基因组织，重复序列形式，蛋白domain和结构单元，建立人类基因组的基因图谱，HIV感染的动力学数学模型，数据库搜索中的序列错误影响的分析，开发新的数据库搜索和多重序列对齐算法，建立非冗余序列数据库，序列相似性的统计显著性评估的数学模型和文本检索的矢量模型。另外，NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。

NCBI的产生和发展是在美国和全球生物学高速发展，高通量数据急速产生，而缺乏有效的数据分析方法的背景下产生，起初它主要任务是数据的存储和查询。只不过其存储的数据大多以高通量数据为主，例如基因测序，基因组，SNP, 基因芯片,小分子化合物和GWAS数据等。这些数据的共享，极大地促进了生物信息学发展。

按照数据->样式->知识->智慧的发展模式，NCBI主要起到了一个为生物学家提供数据的角色。不过，NCBI目前也不断地在调整自己的角色。例如，生物医学文献。NCBI在从NLM继承过来的pubmed的基础，提供以PMC数据库为核心的全文文献服务。PubMed数据库应该是全球生物学家使用频率最高的数据库。NCBI最近对pubmed的改版，虽然没有实质性的改变，但其按照用户体验进行的修改，足见其对该数据库的重视。

另外，NCBI目前不断地在引入高学历生物学人才对其数据库的质量进行控制。以dbSNP为例，其正在通过与领域专家的合作将突变数据与人类表型数据进行关联。

总得来讲，NCBI的发展是与生物学高通量数据产生密切相关，它以经不在局限于提供数据存储与查询，其未来的发展必将发展为一个大型的、综合的知识库。到那时NCBI会不会免费，就要另当别论了。很显然没有人会将自己的手稿拱手让人。如果真有那么一天，不知道从中会产生多少专利和知识产权。

我原来常用的：

NCBI：持有INSDC的节点。网站上有核酸、蛋白、基因名、基因组名等等的搜索工具，以及BLAST序列比对搜索工具，PUBMED文献数据库，Taxonomy数据，COG蛋白家族库等等。FTP可以下到它全部的数据库，BLAST的单机程序，以及各种工具程序。

EBI：和NCBI类似，欧洲搞的对等物。感觉EBI网站比NCBI要清楚简洁。另外EBI网站整合了更多的工具，比如多序列比对。

Uniprot：全蛋白库。NCBI和EBI的蛋白库来源于此。目前包括两部分：SwissProt是人工校对过的，TrEMBL是自动校对的。

Pfam：蛋白家族库。可以使用配套的HMMER进行搜索。比BLAST能找到更远缘的东西，而且找到的东西是结构域。

Rfam：RNA的，类似Pfam。

以上就是关于ncbi，embl和什么并称三大数据库全部的内容，包括:ncbi，embl和什么并称三大数据库、怎么用ncbi构建不同物种的进化关系、如何在NCBI上下载资料等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9823786.html

ncbi，embl和什么并称三大数据库

发表评论

评论列表（0条）