【软博展览展示】让大数据飞 2019软博会来了不少数据处理专家

【软博展览展示】让大数据飞 2019软博会来了不少数据处理专家,第1张

在云计算、大数据等新技术的带动下,越来越多的企业需要对数据进行存储管理、分析挖掘和创新应用。2019软博会上聚集了国内知名的从事数据库、大数据解决方案、数据挖掘分析和产品研发的专业公司。

柏睿数据的全内存流数据库是一个分布式、可扩展、能够在毫秒级内连续、稳定地传输并实时分析处理数据的流数据库。其具备对各行业产生的海量流动数据进行实时数据采集、实时流式数据处理、实时多源并行分析的能力,在数据清洗、数据集成、多传感器网络等领域有着广泛的应用。

以其在制造业领域为例,柏睿数据开发的MPP内存数据仓库引擎能够帮助企业整合内外部数据,强化企业数据资产的管理,实现各领域数据的横纵结合。MPP内存数据仓库Rapids DB/分布式内存流数据库 Rapids StreamDB能够实现企业现有数据、应用系统、软件装备和资源的连接,快速构建数据应用。

优炫软件研发的优炫云数据库(UXDB)是一款为云平台打造的NewSQL数据库系统。全面兼容传统的关系型数据库的数据建模模式,并保证事物处理的一致性,用户可继续使用其熟悉的SQL语言使用优炫云数据库。同时,UXDB还吸纳了NoSQL的横向扩展性和高速的吞吐性能的特性,突破传统关系型数据库无法支持海量数据的局限,以及NoSQL数据存储不能使用SQL语言进行查询的不足。

优炫云数据库(UXDB)适用于各种大数据应用场景,如大数据处理、大型联机交易系统、大型Web应用、数据业务分析等。

内存数据库数据结构分析

按照目前内存芯片密度每年2倍的增长速度,在未来10年中,配置1 G或更大的内存将是很平常的事。内存容量的快速增长对数据库管理系统有着深刻的影响。在某些场合,将整个数据库放进内存是可能的,正常的查询处理可以完全脱离硬盘。另外,和传统的数据库应用相比,有大量的新兴应用,目前的内存大小已经足够了。

在数据库系统中,有2种方法来使用大量的内存。

(1)增大缓冲池 将一个事务所涉及的数据都放在缓冲池中。当采取这种方法的时候,算法优化的目标仍然是最小化磁盘访问。

(2)常驻内存数据库 将整个数据库放进内存中。 这种方法需要重新设计一种数据库管理系统,需要对查询处理、并发控制与恢复的算法和数据结构进行重新设计,以更有效地使用CPU周期和内存。

1 磁盘和内存

内存数据库的索引结构和基于磁盘系统的索引结构不同,面向磁盘的索引结构的目标是最小化磁盘访问次数和空间占用,而面向内存的索引结构全部放在内存中,因此没有磁盘访问次数的最小化。这样,内存索引的目标是减少整体的计算时间同时尽可能少地占用内存。由于关系常驻内存,在索引中没有必要存储真实的属性值,而存储指向元组的指针,当需要的时候通过这些指针能够得到属性值。这样做有4个优点:

(1)单一元组指针便能访问元组的属性和元组本身,这就减少了索引的大小。

(2)避免了处理在索引中的长字段、可变长字段以及压缩技术。

(3)当更新索引 *** 作时,移动指针将比移动属性值更廉价。

(4)由于单个元组指针提供访问这个元组中的任何字段,采用一种特殊的机制多属性索引的需要将减少。

2 物理组织方法

内存数据库的总体设计目标是使内存和CPU的利用率尽可能高,而内存数据库的物理组织是实现该目标的基础,其存储结构、索引结构、中间数据存储结构都必须考虑内存的直接存取这一特征,这里介绍几种适合于内存数据库的物理组织方法。

21 区-段式

区-段式组织是基于关系数据模型的。他将存储空间逻辑划分为“分区”,每一个分区存储一个关系。由若干“段”组成,一个段是内存中固定长度的连续区域,相当于“页”,但比页大,是内外存I/O的单位,也是内存空间分配以及内存数据库恢复的单位

 一个段中的一个数据记录就是一个关系元组。每个记录有一个惟一的标识符RID(Record Identifier),他是一个三元组<P,S,L>,其中P,S,L分别为分区号、段号、段内的记录槽号,记录槽(RecordSlots)包含了对应记录的长度和记录的首地址。这样由RID经分区表和相对应的段表找到相对应的记录槽,按槽中的地址和长度便可直接存取所要的记录。其实,对于内存数据库,存取方法返回的不必是所需的记录数据的副本,只需将其槽中的地址返回即可。

2.2 影子内存式

按影子内存式组织的内存数据库空间可以划分为2部分:一部分是MMDB的主拷贝;另一部分为“影子拷贝”。

在事务的正常 *** 作期间,每次查询都产生一个分别对于影子内存SM(ShadowMemory)和主拷贝PDB(Primary DataBase)的双地址,且总是先对SM试探,若不成功,再对PDB *** 作。所有的更新 *** 作都在SM中进行,且都记录在活动日志中(Active Log)。每当一个事务提交时,由他所产生的在SM中的“后映像”拷贝到PDB中。使用影子内存的优点是:

(1)减少了日志缓冲区,因为其后映像区和用户区合二为一。

(2)省去因事务失败或系统故障时的UNDO *** 作,只清除相应的影子内存即可。

(3)减少对MMDB(PDB)存取,各事务可并行对各SM区 *** 作。

(4)缩短恢复过程,这是因为一方面如(2)所述,省去UNDO型 *** 作,只需做REDO型 *** 作;另一方面还可以就当前事务对SM做“部分恢复”以后,就先启动正常事务处理,然后按需要逐步恢复PDB。

影子内存式和区-段式可以组合使用

以上就是关于【软博展览展示】让大数据飞 2019软博会来了不少数据处理专家全部的内容,包括:【软博展览展示】让大数据飞 2019软博会来了不少数据处理专家、谁可以告诉我一些关于内存数据库的情况、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9726625.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存