一:传统数据库
(1)传统索引不适于海量数据
传统行存数据库索引需要手工设定,对应用不完全透明,随场景和需求的变化需要不断调整,人工维护成本很高。并且传统索引占用存储空间很大,甚至高于数据本身,造成查询效率的下降。
(2)数据装载速度慢
因为索引需要重新创建,加载性能会变的很糟糕。分析型架构系统要解决这些个问题,必须最大限度地减少磁盘 I/O ,提升查询效率,减小人工维护成本。南大通用分析型数据库GBase8a (以下简称GBase 8a)通过列存储模式、数据压缩、智能化的索引、并行处理、并发控制、高效的查询优化器等技术,使得上述问题得到有效解决。以下各节将描述 GBase 8a 的创新架构如何实现这些目标。
二:新型数据库
新型数据库采用分布式并行计算架构,部署于X86通用服务器,满足大数据实时交易需求,成本低、扩展性高,突破了传统数据库性能瓶颈。
分布式非关系型数据库技术创新
非关系型数据库即NoSQL,抛弃了关系数据库复杂的关系 *** 作、事务处理等功能,仅提供简单的键值对(Key, Value)数据的存储与查询,换取高扩展性和高性能,满足论坛、博客、SNS、微博等互联网类应用场景下针对海量数据的简单 *** 作需求。主要技术创新为:
(1) 简单的数据 *** 作换取高效响应。NoSQL仅支持按照Key(关键字)来存储和查询Value(数据),不支持对非关键字数据列的高效查询因数据 *** 作简单、数据间一般不需要关联 *** 作,故系统可支持高并发和较快的响应速度。
(2) 多种一致性策略满足业务需求。不同于传统关系型数据库仅支持强一致性策略,NoSQL还支持弱一致性和最终一致性等多种策略,可根据应用场景进行对应配置。例如,对写入 *** 作频繁,但数据读取最新版本要求并不严格的应用,如互联网网页数据的存储和分析应用,可以采用最终一致性策略而对订购关系存储的应用,则必须用强一致性策略,保证总是读取最新版本数据
1、EI数据库:著名工程技术类综合性检索工具。它收录论文的题录、摘要,并以主题词、分类号进行标引深加工。外文较多。
2、读秀数据库:号称最大的中文书籍数据库,又开发了其它的库,如期刊、文档,报纸等。
3、万方数据库的特点:一个字“精”。科技文献都是精品,万方的医药数据库,权威性高。外文靠的是文献传递。
4、CNKI数据库:一个字“全”。收录量与期刊数是最全的,也是目前发展最好的中文期刊全文数据库。
CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。CNKI工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆"。
万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。
万方会议论文:《中国学术会议论文全文数据库》是国内唯一的学术会议文献全文数据库,主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文,数据范围覆盖自然科学、工程技术、农林、医学等领域,是了解国内学术动态必不可少的帮手。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)