数据库集群的性质

数据库集群的性质,第1张

一.与分布式数据库系统的区别 数据库集群有的具有单份数据集,有的具有两份或多份相似的数据集,有的具有两份或多份实时一致的数据集;而分布式数据库系统往往具有完全不同的数据集。 数据库集群往往是同构的系统,要求集群各节点都具有相同的 *** 作系统和数据库系统版本,甚至补丁包的版本也要求保持一致;而分布式数据库系统可以是异构系统,包含不同的 *** 作系统和不同的数据库系统。 数据库集群往往建立在高速局域网内;而分布式数据库系统既可以是高速局域网,也可以是跨部门、跨单位的异地远程网络。 二.数据库集群的技术指标

由于数据库系统是任何一个信息系统的核心,因此除了业务逻辑之外,用户还关心下面三点:

1. 系统性能

性能问题涉及硬件、软件、网络、应用设计架构、代码质量等多方面。但是数据库集群如果能提供负载均衡能力和自动优化能力,则是对整个系统性能具有莫大的好处。

2. 数据可靠性

在系统发生任意故障(包括 *** 作系统、数据库引擎、硬盘或磁盘阵列或存储网络等故障)条件下数据丢失的可能性。有的系统从设计原理上注定了必然会存在理论上的数据丢失可能性,而有的系统因为冗余设计原理,可以保证理论上的数据零丢失。用容灾领域的术语来讲,这类似于RPO(Recovery Point Objective),但是不完全等同于RPO。

3. 服务可用性

在系统发生任意故障(包括 *** 作系统、数据库引擎、硬盘或磁盘阵列或存储网络等故障)条件下整个系统停止对外提供数据服务的可能性。与上面的数据库可靠性紧密关联,如果一个系统从理论上存在数据丢失的可能性,那么这样的系统必然会导致整个系统的服务停止。同样地,用容灾领域的术语来讲,这类似于RTO(Recovery Time Objective),但是也同样不能完全等同于RTO。

三.数据库集群的分类

在市场上,数据库集群是一个笼统的名词,没有一个权威的定义,各市场参与者往往是各取所需,推出各种特色的数据库集群解决方案。一般地具有下列四种集群方案:

1.基于串行数据复制技术

串行复制技术,本来是用于数据传送和数据备份的,离人们熟悉的“数据库集群”的概念有一定的距离。但是由于计算机软硬件技术和网络通讯技术的快速发展,使得利用这种概念和技术构成的“数据库集群”有了一定的可行性。此类集群,又可以分两类:

a.串行异步复制

此种方式是数据的异步串行复制。主要采用数据库事务日志传送或者硬盘数据块传送技术来实现,SQL Server自带的复制、镜像和SQL2012新出的AlwaysON(备机可读)以及第三的一些镜像Mirror技术都是属于此类产品,此类技术和产品本质上就是数据备份技术和产品。下列以事务日志传送(Log Shipping)为例来说明。主数据库完成事务处理后,生成事务处理日志,日志记录通过FIFO队列,进入备份数据库处理,从而得到备份数据。此种方式的缺陷在于:

a) 主数据库并行处理事务而日志拷贝是串行的,而备份数据库处理日志记录也是串行的。因此,FIFO队列的溢出随时可能发生。一旦发生,队列必须重建,从而需要重新建立备份数据库。此种方法对于一般客户来讲是不可行的。

b) 由于日志拷贝是异步的,主备数据库不是实时一致,两者之间存在“时间差”,因此如果用备份数据库作负荷均衡,这样的应用存在逻辑上的漏洞,可能会发生数据错乱。

c) 由于主备数据存在时间差, 主数据库一旦发生事故,理论上一定会丢失数据。在这种情况下,要么需要手工恢复数据库,这会消耗大量的人工成本,或者数据根本就不能恢复。

d) 对主机的性能影响,根据测试一般在15%到25%之间。

b.串行同步复制

此类集群往往是由昂贵的专用软硬件构成的,原理图如下:

此类系统采用专用的高速网络和软件技术,将每个数据库的请求,通过同步复制的方式,同步在主备两台数据库服务器上执行正确后,才将结果返回给数据库客户。此系统的特点是:

a) 主数据库被强迫与备份数据库同步串行处理,因此性能受到限制。

b) 主备数据库中任意一个出现问题,都会迫使事务处理交易回滚,因此整个系统的可靠性比单机系统降低了一半。

c) 由于以上问题,这种备份方式只适用于近距离光纤网络(5英里)。

d) 专用系统造价昂贵,又加上述明显缺陷,因此市场上很少被采用。

2.基于共享存储的双机容错技术

从技术适应性的角度讲,双机容错比较适合于无状态应用,或者状态信息较少的应用切换,以此达到应用级的高可用性目的,其实并不适合于数据库级的应用切换。

此种结构往往是两个服务器共享一个磁盘阵列,这里两个服务器共享一个虚拟的IP供数据库客户使用,形成一个单一的逻辑数据库映象。此种所谓的数据库集群的目的是,一旦主机系统出现问题,备份系统通过心跳机制的检测,完成从主机系统到备份系统的切换。这种方案在市场上被称为“双机集群”或者“双机热备”,简称参见“双机”,但微软称之为“故障转移集群”。它有下列特点:

a. 此种高可用性解决方案只是无状态系统(典型的如Web服务器)的普通容错切换思想在数据库领域的应用。

b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此共享的磁盘阵列成为了整个系统的单点错误源。

c. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。

d. 主机系统和备份系统之间是没有任何负载均衡关系的,在正常情况下,备份系统是闲置在那里,因此对用户来说是一种投资浪费。

e. 在错误切换的时候,往往存在切换时间长,而且更严重的是可能会存在丢失用户交易数据丢失的现象,结果导致系统被迫停止服务,或者需要人工修复数据,或者数据永远找不回来。

3.以Oracle RAC为代表的系统

RAC的英文全称是:Real Application Cluster(真正的应用级集群)。我们需要关注的是“应用级”。为了缓解数据库系统日益增长的性能压力,Oracle公司推出了RAC系统。它基本结构如下:

此类系统,专门是针对数据库性能问题而提出的。采用共享磁盘阵列的方式,因此在结构上和上述双机容错相似,不同的地方在于此系统中的数据库节点之间采用的不是简单的心跳检测,而是Oracle公司自己定义的一套复杂的信息交换协议,以此来动态分配来自数据库客户端的请求。它的特点是:

a. 是个应用级的集群,也就是针对Oracle的数据库管理系统(因为数据库管理系统对于 *** 作系统来讲,就是一个“应用程序”,因此被称为“应用级集群”),专门为提高数据库性能而设计。

b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此享的磁盘阵例成为了整个系统的单点错误源。

c. 管理配置复杂。

d. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。

e. 由于数据库系统本身具有高I/O的特性,因此,RAC系统里,磁盘I/O是提高性能的关键地方。

f. 依据不同的数据库应用,有的性能有所提升,有的性能可能会反而下降。

1 提高性能

一些计算密集型应用,如:天气预报、核试验模拟等,需要计算机要有很强的运算处理能力,现有的技术,即使普通的大型机器计算也很难胜任。这时,一般都使用计算机集群技术,集中几十台甚至上百台计算机的运算能力来满足要求。提高处理性能一直是集群技术研究的一个重要目标之一。

2 降低成本

通常一套较好的集群配置,其软硬件开销要超过100000美元。但与价值上百万美元的专用超级计算机相比已属相当便宜。在达到同样性能的条件下,采用计算机集群比采用同等运算能力的大型计算机具有更高的性价比。

3 提高可扩展性

用户若想扩展系统能力,不得不购买更高性能的服务器,才能获得额外所需的CPU 和存储器。如果采用集群技术,则只需要将新的服务器加入集群中即可,对于客户来看,服务无论从连续性还是性能上都几乎没有变化,好像系统在不知不觉中完成了升级。

4 增强可靠性

集群技术使系统在故障发生时仍可以继续工作,将系统停运时间减到最小。集群系统在提高系统的可靠性的同时,也大大减小了故障损失。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10006590.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存