生物信息数据库分为哪四大类

生物信息数据库分为哪四大类,第1张

按大小可以分为1公共数据库

2 从公共数据库中取数据做进一步处理的专业数据库,提供更多的分析工具

按功能分可以有

基因库GENEBANK,蛋白库UNIPROT, 结构库PDB, 功能分类 GO库,通路库 KEGG。

不用专注于4这个数字。随着科研的进步还会有更多的数据库出来。

1、属性不同

Go(又称 Golang)是 Google 的 Robert Griesemer,Rob Pike 及 Ken Thompson 开发的一种静态强类型、编译型语言。功能:内存安全,GC(垃圾回收),结构形态及 CSP-style 并发计算。

KEGG 是了解高级功能和生物系统(如细胞、 生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。

2、性质不同

go是计算机编程语言。

KEGG基因组破译方面的数据库。

扩展资料:

Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的其他语言包括Occam和Limbo。

但它也具有Pi运算的特征,比如通道传输。在18版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分函数。

与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口(Interface)等特性的语言级支持。Go 20版本将支持泛型,对于断言的存在,则持负面态度,同时也为自己不提供类型继承来辩护。

不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典(Dictionaries)),就像字符串类型一样。

KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。

人工创建了一个知识库,这个知识库是基于使用一种可计算的形式捕捉和组织实验得到的知识而形成的系统功能知识库。它是一个生物系统的计算机模拟。

与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。

参考资料来源:百度百科-go

参考资料来源:百度百科-KEGG

会阻碍我国生物科技的发展。

在大数据时代,科研数据难以共享将成为国内生命科学研究的一大障碍。科学家用传统方法可能要花一辈子才能解决的难题,大数据可能只要几个月就能找到答案。能够获得和整合数据,然后再进行快速和精准的分析,已成为生命科学研究的关键。

深圳市大鹏新区大鹏街道下沙片区禾塘仔,这里依山傍海,环境优美,背山面海的几栋白色的建筑并不起眼,但令人难以置信的是,庞大的数据如同螺旋一般,每天从这里源源不断地涌出。这些白色的梯田造型的建筑就是中国首个获批筹建的国家基因库,也是目前全球最大的综合性基因库。

国家基因库项目一期占地面积475万平方米,拥有基因测序房、超级计算房以及冷冻资源房,相较于其庞大的建筑规模,它丰富的内容更是令人瞠目结舌:国家基因库目前已存储多种生物资源样本1000万份,可检索生物信息条目数已经超过一个亿,我国更是计划把它打造成为中国的诺亚方舟,建立一个巨大的生物活体库,保护和保存世界约三十万种植物、百万种动物、近千万种微生物活体资源。如此大手笔、高规格的项目究竟什么来头?建立国家基因库的意义何在?下面就让我们一起走进关于国家基因库的专业解读。

图1 位于深圳市大鹏新区的国家基因库一期项目

“干”“湿”“活”三位一体

在我国建立基因库之前,美国、欧洲和日本就已经建立了大型基因数据库,而且这三大库里的生物信息数据几乎涵盖所有已知的脱氧核糖核酸、核糖核酸和蛋白质数据。中国国家基因库与这三大库的不同就在于,它不仅仅是数据库,而是国际上现有的各类生物样本库、数据库、生物多样性库、疾病库等的综合升级版。除了所谓的“干库”,——基因、蛋白、分子、影像等多组学生物信息数据库,和“湿库”——多样性生物样本和物种遗传资源库之外,中国的国家基因库还引入了“活库”,也就是生物活体库,将存储的内容扩展到动物资源、植物资源、微生物资源和海洋资源。同时,该基因库不仅面向科研,还面向推动中国精准医学、精准农业的发展,利用对基因信息的掌控推动产业的发展。

图2 国家基因库中的生物信息数据库

基因的“国库”

2011年,国家发改委等4部委批复同意深圳依托华大基因研究院组建国家基因库,今年9月,国家基因库正式投入运营,这是中国首个获批筹建的国家基因库,同时也是目前为止的唯一一个。

国家基因库有“超测”、“超算”、“超存”的能力:其中,人类资源方面基因库主要保存血液样本、组织样本、细胞系、细胞和尿液等,将为重大疾病的前瞻性研究提供样本资源支撑,为疾病诊断与预测及个性化医疗等奠定基础。在动物资源方面,基因库主要保存珍稀动物及具有重要经济价值的动物组织、细胞等。此外,国家基因库除了存储人类资源、动物资源以外,还存储植物资源、海洋资源和微生物资源。这些都可以为日后的研究工作收集大量的信息。这个建设中的基因“国库”,数据规模到底有多大?打个形象化的比方,目前深圳国家基因库已建成20 Pb数据的可访问能力,以一部**约500Mb计算,20Pb相当于四千万部**,一个人一天看一部**,至少需要10万年才能看完。

存储健康的“生命银行”

2015年1月,美国总统奥巴马在国情咨文演讲中谈到“人类基因组计划”所取得的成果,并宣布新的项目——— 精准医疗计划。更有专家表示,精准医疗计划在时间上是承接人类基因组计划,在本质上是对现行的以药物治疗为主体的医疗进行改革。科学家们认为,绝大多数的疾病都可以通过基因测序得以提前防范和管理。那么,基因测序究竟如何“锁定”疾病?以一个形象化的比喻来解释,一个D N A的正常表达可以理解为一段文字,如果该文字中出现一个错别字,可能就失去其正确意义。测序就是要与正常序列比对,找出哪个细胞哪里出错。通过测序结果,分析基因突变的部分,就能够找到某个疾病对应的基因,方便对症下药。事实上,每个人一生中所有关键阶段的标本都应该永久保存起来:比如出生时的干细胞,20岁时的免疫细胞,30岁时的生殖细胞等等……而国家基因库,就是储存这些样本和数据的地方,它就像是人类的“生命银行”一般。通过有意识地存储自己的健康数据,让人们对自己身体变化状况了如指掌,并且根据这些数据设计自己的饮食、运动和生活节奏,“对抗”衰老。

深圳国家基因库建成后,这个巨型“生命银行”将为中国生命科学研究和生物产业发展提供基础性和支撑性服务平台,储存和管理中国特有的遗传资源、生物信息和基因数据。同时,以生物资源为依托,形成从资源到科研到产业的全贯穿、全覆盖模式,实现大资源、大数据、大科学、大产业的整合与应用。

图3 国家基因库的工作人员将细胞样品放入液氮中保存

在农业时代,一个国家拥有的耕地越多优势越大;在工业时代,拥有的石油、矿产等能源越多优势越大;而在生命时代,拥有更多基因资源同时能对基因资源进行认知和利用,则意味着更大的优势。国家基因库的成立,正在为我国积累全新的优势。目前,国家基因库已与联合国粮食及农业组织、国际农业研究磋商小组、国际生物及环境样本库协会、挪威斯瓦尔巴全球种子库、美国自然历史博物馆等100多个组织和科研机构建立战略合作关系,将在人类健康、生物多样性、生物进化机制等方面开展合作研究。

出品:科普中国

制作:爱科范儿团队

监制:中国科学院计算机网络信息中心

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。

本文由科普中国融合创作出品,转载请注明出处。

ncRNA(non-coding RNA) 就是非编码RNA ,如小分子核仁RNA(sonRNA)、小RNA(miRNA)、小干扰RNA(siRNA)。NcRNA应该是遗传信息的携带者,RNA的一种,目前主要有三大种tRNA|转运RNA,翻译|mRNA信使RNA,转录||rRNA核糖体RNA构成核糖体

1是作为生物信息学最重要的专门期刊了。2012年度IF=5468

2另外还有Briefingsin,这个杂志每年的发稿量少,最近几年IF波动很大,第一年24,后来到9,2012年度IF=5202。

3稍次一点的杂志,如BMC,也是生物信息学的专刊。2012年度IF=3447

4对于计算向的生物信息学,PLOSBiology是一个很好的期刊。2012年度IF=5215

5除此之外,NatureMethod,也会有生物信息学相关的方法发表。2012年度IF=19276

生物信息学相关的文章不一定要发到专门的生物信息学杂志,因为生物信息学作为一个工具,已经融入到很多生物问题的研究中,而不仅仅是一门孤立的学科了。

PLOSBiology也是很好的杂志,2012年度IF=11452。PLOSOne也会经常有生物信息学文章,但被批灌水太多,算不得牛刊,2012年度IF=4092。

根据需要从一级数据库中搜集对象的相关数据集合而成的就是二级数据库

像genebank,EMBL这种都是不加选择的一级数据库,只要是实验获得的,不管什么东西的序列,哪怕是不完整的序列都能上传,而且它们的数据也有可能有重复如果有某个人专门研究细菌的鉴定,需要用到正式被认可的16srDNA序列,为了研究方便,把这些一级数据库的各个种类细菌的公认标准16srDNA序列的数据进行整理,重新构建了一个数据库,这就是所谓的二级数据库如果不构建,直接用一级数据库做blast,就会得出很多未被承认甚至不完整的序列,还要人工一个个看过去,找出公认的标准序列,这样就很麻烦我举得例子在现实中就是韩国的EzTaxon

以上就是关于生物信息数据库分为哪四大类全部的内容,包括:生物信息数据库分为哪四大类、GO 和 KEGG 的区别、如果生物信息数据库中的数据不共享了,会给我们带来什么麻烦,有什么等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9379549.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存