什么是HACMP_IT百科

1.hacmp的定义

2.hacmp的历史和发展

1.1 什么是HACMP?

在解释这个问题前,我们先看一下高可用的定义.

高可用性:

在今天复杂的环境中,提供连续不见断的应用程序的服务是IT实施中关键的组成部分.高可用性是消除计划的和非计划的系统和应用停顿的,为应用程序的客户端提供连续的服务的组成部分之一.目的是为了达到消除硬件和软件的单点故障(SPOF).

高可用性解决方案将确保硬件,软件或者系统管理维护的失效不会导致应用和数据对用户的不可用.高可用行解决方案通过合理的设计,计划,选择硬件,配置软件,小心的管理训练,来消除单点故障.

当机时间:

当即时间是应用不能服务他的客户端的时间,我们把当机时间分为下列几类:

计划的:硬件升级,修理,软件升级,离线备份,测试.

非计划的:管理故障,应用失效.硬件故障,环境灾祸.

IBM高可用的解决方案是基于IBM著名的集群技术在AIX上实现的高可用集群多处里系统,有两部分组成:

1.高可用:通过复制或共享资源保证应用对用户是可用的.

2.多处理集群:多个应用运行在同样的节点上共享或并发存取数据.

基于HACMP的解决方案实现了自动的错误检测,诊断,应用恢复,和节点控制.有合适的应用支持下,HACMp可以支持并行的应用进程并发的存取数据,提供很好的可测量性.

一个典型的HACMP环境如下图所示:

1.1.1 历史与发展演化

IBM的HACMP可以追述到九十年代早期,在1990年开始为RS/6000上的应用开发和提供高可用的解决方案.

我们不在提供早期版本的信息,因为这些版本已经已经不在被使用和支持当这本书出版的时候,作为替代,我们重点描述最近版本的信息.

hacmp V4.2.2

沿着hacmp发展的杰作,这个版本引入了基于RSCT(可靠的,可升级的集群拓扑)的ES(增强可测量性),组和事件管理服务,起源与并行系统支持程序.

hacmp V4.3X

这个版本引入了32节点支持,C-SPOC增强,ATM网络支持,hacmp任务向导(简单集群配置的GUI),多中事件前和事件后脚本,FDDI的MAC地址接管,监视和管理支持增强,节点到节点的迁移和AIX快速连接支持.

hacmp V4.4X

新版本整合了tivoli,应用监控,无依靠的cascading,C-SPOC增强,改良了迁移的支持,整合了HA-NFS功能和软拷贝的文档(html和pdf).

hacmp V4.5

在这个版本中,aix5l是必须的,融入了自动配置发现特性,多服务标签在每一个网络适配器上(使用IP别名),持久的IP地址支持,64位的API和监视与恢复卷组quorum丢失.

hacmpv5.1

这个版本引入了更多的改变,从配置的简单化和改变hacmp术语的性能的增强,一些重要的新特性如下:

smit中加入了标准和扩展配置路径.

自动的配置发现

可定制的资源组.

磁盘上不基于IP网络的心跳信号.

快速磁盘接管.

强制激活卷组.

在IP别名上的心跳传递.

不存在经典的hacmp,现在只有基于IBM可靠的,可升级的集群拓扑的hacmp扩展版.

提高安全性,通过使用集群后台通信程序取代了aix的R*命令,消除了对/.rhosts文件的依赖.

提高了集群定制和同步的性能.

标准化的hacmp术语.

简化配置和维护(这里红皮书上有一些重复,不明白为什么重复.)

hacmp v5.2

开始于2004年七月的5.2版本加入了管理,简化配置,自动化和性能区域的许多提高.下面有一个汇总:

双节点配置助手,有smit菜单和一个java的接口.

文件收集??

用户密码的管理

不再使用典型的资源组,而是以定制的资源组作为替代,

自动测试程序.

自动的集群效验确认.

改良的在线计划工作表,可以从一个存在的集群中导入配置

事件管理被资源监控和控制子系统(RMC,aix的标准组件)替代

增强安全性

资源组依赖

自修复集群

HACMP

心跳

和其他许多类型的集群一样，心跳用来检测网络接口，通信设备，

标签

(

服务的，非服务的，

永久性的

IP)

以及节点本身的可用性。

从

HACMP V5.1

开始，心跳是专有的，基于

RSCT

拓扑的服务（这样，

HACMP V5.1

仅有的

增强的可扩展性，

经典的通过网络模块的心跳，

直接被集群管理后台控制）

心跳是通过集群中每

两个节点间的每个通信设备传递和交换的信息

(

保活数据包

)

。

每一个集群中的节点定时的间隔发

送心跳信号到其他节点，

并且预期的接受心跳信号从相应的节点。

如果接受的信号中断了，

RSCT

认可这一个错误并告诉

HACMP

，

HACMP

将执行合适的恢复动作。

心跳信息可以通过两种网络传送：



TCP/IP

网络



点到点非

网络

为了避免

HACMP

集群的分离，

HACMP

必须能区分节点故障和

TCP/IP

网络故障。

TCP/IP

网

络可以因为不完美的网络元素

(

交换机，

集线器和电缆等

)

而发生故障，

当这种情况发生时，

集群

中的节点不能通过

发送心跳信号，所以每个节点考虑到对方节点故障而都去尝试获得资源，

这将导致一个潜在数据问题，特别是使用了并发的资源组时。

非

网络是在两个节点间直接的点对点连接，不再使用

进行心跳信号的交换，也因此减少

了

网络的故障带来的问题。假如这样的网络类型使用了，那么当

网络故障时，节点仍然

可以交换信息，可以判定网络故障而不会发生资源组的接管 *** 作。

为了避免

HACMP

被分开，我们推荐配置冗余的网络

(IP

网络和非

网络

)

，

同时使用这两种网

络。建议使用的两个节点的群集参见

Figure 2-3

。

2.3.1.

通过磁盘的心跳信号

通过磁盘的心跳是

HACMP

V5.1

的新特性，提供了对防止集群分割和单个非

网络的附加的

保护，特别是当

RS-232

和

tmssa

、

tmscsi

等连接太复杂或无法实现时。

这种类型的网络可以使用许多类型的共享磁盘存储

(

光纤通道，

SSA

和

SCSI

等

)

，磁盘用来交

换

信息的一段只是作为

AIX

增强并发卷组的一部分，

它不是排外性的仅作为这个目的使用，

它们仍然可以用来存贮应用共享的数据。

客户需要使用目标模式的光纤通道连接，

但是对于异构的

环境

(adapter

，

存储子系统，

SAN

交换机

)

，这将很难实施和支持。

使用共享磁盘来交换信息是更可靠的非

网络，并且不依赖于特定的硬件。

此外，

在一个

SAN

环境中，当使用光纤连接设备，非

网络的光纤的长度仅仅是

SAN

的限制，因此允许非常长

的点对点的网络。

当定义一个磁盘作为增强的并发卷组，这个磁盘的一部分

(

一部分扇区

)

将不能给

lvm

使用，将

用来在两个节点间交换信息。

使用基于磁盘的心跳的详细说明如下：



一个磁盘可以用来做两个节点间的一个网络，

这个磁盘在两个节点上使用相同的唯一的

特定的标识的

PVID

。



推荐在一个存储范围内的一对节点间

（或者一个磁盘柜）

的一个磁盘配置磁盘心跳网络。



该磁盘需要是增强并发卷组的一部分，虽然并不要求卷组激活或者是资源组的一部分。

仅仅的限制是

必须同时定义在两个节点上。

注意：集群中并发卷组的锁机制不再需要保留磁盘的一部分来通信，而是以

RSCT

组服务替代。

2.3.2.

通过

别名的心跳

对于

网络，引入了一个新的心跳机制：通过

别名的心跳。这使得集群不再需要或者可能

再改变通信接口基本

地址。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/bake/11310407.html

什么是HACMP

发表评论

评论列表（0条）