2.hacmp的历史和发展
1.1 什么是HACMP?
在解释这个问题前,我们先看一下高可用的定义.
高可用性:
在今天复杂的环境中,提供连续不见断的应用程序的服务是IT实施中关键的组成部分.高可用性是消除计划的和非计划的系统和应用停顿的,为应用程序的客户端提供连续的服务的组成部分之一.目的是为了达到消除硬件和软件的单点故障(SPOF).
高可用性解决方案将确保硬件,软件或者系统管理维护的失效不会导致应用和数据对用户的不可用.高可用行解决方案通过合理的设计,计划,选择硬件,配置软件,小心的管理训练,来消除单点故障.
当机时间:
当即时间是应用不能服务他的客户端的时间,我们把当机时间分为下列几类:
计划的:硬件升级,修理,软件升级,离线备份,测试.
非计划的:管理故障,应用失效.硬件故障,环境灾祸.
IBM高可用的解决方案是基于IBM著名的集群技术在AIX上实现的高可用集群多处里系统,有两部分组成:
1.高可用:通过复制或共享资源保证应用对用户是可用的.
2.多处理集群:多个应用运行在同样的节点上共享或并发存取数据.
基于HACMP的解决方案实现了自动的错误检测,诊断,应用恢复,和节点控制.有合适的应用支持下,HACMp可以支持并行的应用进程并发的存取数据,提供很好的可测量性.
一个典型的HACMP环境如下图所示:
1.1.1 历史与发展演化
IBM的HACMP可以追述到九十年代早期,在1990年开始为RS/6000上的应用开发和提供高可用的解决方案.
我们不在提供早期版本的信息,因为这些版本已经已经不在被使用和支持当这本书出版的时候,作为替代,我们重点描述最近版本的信息.
hacmp V4.2.2
沿着hacmp发展的杰作,这个版本引入了基于RSCT(可靠的,可升级的集群拓扑)的ES(增强可测量性),组和事件管理服务,起源与并行系统支持程序.
hacmp V4.3X
这个版本引入了32节点支持,C-SPOC增强,ATM网络支持,hacmp任务向导(简单集群配置的GUI),多中事件前和事件后脚本,FDDI的MAC地址接管,监视和管理支持增强,节点到节点的迁移和AIX快速连接支持.
hacmp V4.4X
新版本整合了tivoli,应用监控,无依靠的cascading,C-SPOC增强,改良了迁移的支持,整合了HA-NFS功能和软拷贝的文档(html和pdf).
hacmp V4.5
在这个版本中,aix5l是必须的,融入了自动配置发现特性,多服务标签在每一个网络适配器上(使用IP别名),持久的IP地址支持,64位的API和监视与恢复卷组quorum丢失.
hacmpv5.1
这个版本引入了更多的改变,从配置的简单化和改变hacmp术语的性能的增强,一些重要的新特性如下:
smit中加入了标准和扩展配置路径.
自动的配置发现
可定制的资源组.
磁盘上不基于IP网络的心跳信号.
快速磁盘接管.
强制激活卷组.
在IP别名上的心跳传递.
不存在经典的hacmp,现在只有基于IBM可靠的,可升级的集群拓扑的hacmp扩展版.
提高安全性,通过使用集群后台通信程序取代了aix的R*命令,消除了对/.rhosts文件的依赖.
提高了集群定制和同步的性能.
标准化的hacmp术语.
简化配置和维护(这里红皮书上有一些重复,不明白为什么重复.)
hacmp v5.2
开始于2004年七月的5.2版本加入了管理,简化配置,自动化和性能区域的许多提高.下面有一个汇总:
双节点配置助手,有smit菜单和一个java的接口.
文件收集??
用户密码的管理
不再使用典型的资源组,而是以定制的资源组作为替代,
自动测试程序.
自动的集群效验确认.
改良的在线计划工作表,可以从一个存在的集群中导入配置
事件管理被资源监控和控制子系统(RMC,aix的标准组件)替代
增强安全性
资源组依赖
自修复集群
HACMP心跳
和其他许多类型的集群一样,心跳用来检测网络接口,通信设备,
IP
标签
(
服务的,非服务的,
永久性的
IP)
以及节点本身的可用性。
从
HACMP V5.1
开始,心跳是专有的,基于
RSCT
拓扑的服务(这样,
HACMP V5.1
仅有的
增强的可扩展性,
经典的通过网络模块的心跳,
直接被集群管理后台控制)
心跳是通过集群中每
两个节点间的每个通信设备传递和交换的信息
(
保活数据包
)
。
每一个集群中的节点定时的间隔发
送心跳信号到其他节点,
并且预期的接受心跳信号从相应的节点。
如果接受的信号中断了,
RSCT
认可这一个错误并告诉
HACMP
,
HACMP
将执行合适的恢复动作。
心跳信息可以通过两种网络传送:
TCP/IP
网络
点到点非
IP
网络
为了避免
HACMP
集群的分离,
HACMP
必须能区分节点故障和
TCP/IP
网络故障。
TCP/IP
网
络可以因为不完美的网络元素
(
交换机,
集线器和电缆等
)
而发生故障,
当这种情况发生时,
集群
中的节点不能通过
IP
发送心跳信号,所以每个节点考虑到对方节点故障而都去尝试获得资源,
这将导致一个潜在数据问题,特别是使用了并发的资源组时。
非
IP
网络是在两个节点间直接的点对点连接,不再使用
IP
进行心跳信号的交换,也因此减少
了
IP
网络的故障带来的问题。假如这样的网络类型使用了,那么当
IP
网络故障时,节点仍然
可以交换信息,可以判定网络故障而不会发生资源组的接管 *** 作。
为了避免
HACMP
被分开,我们推荐配置冗余的网络
(IP
网络和非
IP
网络
)
,
同时使用这两种网
络。建议使用的两个节点的群集参见
Figure 2-3
。
2.3.1.
通过磁盘的心跳信号
通过磁盘的心跳是
HACMP
V5.1
的新特性,提供了对防止集群分割和单个非
IP
网络的附加的
保护,特别是当
RS-232
和
tmssa
、
tmscsi
等连接太复杂或无法实现时。
这种类型的网络可以使用许多类型的共享磁盘存储
(
光纤通道,
SSA
和
SCSI
等
)
,磁盘用来交
换
KA
信息的一段只是作为
AIX
增强并发卷组的一部分,
它不是排外性的仅作为这个目的使用,
它们仍然可以用来存贮应用共享的数据。
客户需要使用目标模式的光纤通道连接,
但是对于异构的
FC
环境
(adapter
,
存储子系统,
SAN
交换机
)
,这将很难实施和支持。
使用共享磁盘来交换信息是更可靠的非
IP
网络,并且不依赖于特定的硬件。
此外,
在一个
SAN
环境中,当使用光纤连接设备,非
IP
网络的光纤的长度仅仅是
SAN
的限制,因此允许非常长
的点对点的网络。
当定义一个磁盘作为增强的并发卷组,这个磁盘的一部分
(
一部分扇区
)
将不能给
lvm
使用,将
用来在两个节点间交换信息。
使用基于磁盘的心跳的详细说明如下:
一个磁盘可以用来做两个节点间的一个网络,
这个磁盘在两个节点上使用相同的唯一的
特定的标识的
PVID
。
推荐在一个存储范围内的一对节点间
(或者一个磁盘柜)
的一个磁盘配置磁盘心跳网络。
该磁盘需要是增强并发卷组的一部分,虽然并不要求卷组激活或者是资源组的一部分。
仅仅的限制是
VG
必须同时定义在两个节点上。
注意:集群中并发卷组的锁机制不再需要保留磁盘的一部分来通信,而是以
RSCT
组服务替代。
2.3.2.
通过
IP
别名的心跳
对于
IP
网络,引入了一个新的心跳机制:通过
IP
别名的心跳。这使得集群不再需要或者可能
再改变通信接口基本
IP
地址。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)