一 安装前环境设定
两台主机硬件环境(不必完全一致):
CPU: Xeon 3G 2 (EM64T)
MEM: 2G
NIC: Intel 1G 2
eth0: 对外IP
eth1: 对内IP(HA专用)
两台主机的eth1使用双机对联线直接连接。
分区方式:
Filesystem 容量 挂载点
/dev/sda2 97G /
/dev/sda6 45G /Datas
/dev/sda1 99M /boot
none20G /dev/shm
/dev/sda3 97G /opt
另外每台主机应预留500M的raw空间或者更多来作为共用空间被HA使用。
*** 作系统:
RedHat Enterprise 4 Update2 (269-22 EL)
预安装软件:
@ X Window System
@ GNOME Desktop Environment
@ KDE Desktop Environment
@ Editors
@ Engineering and Scientific
@ Graphical Internet
@ Text-based Internet
@ Authoring and Publishing
@ Server Configuration Tools
@ Development Tools
@ Kernel Development
@ X Software Development
@ GNOME Software Development
@ KDE Software Development
@ Administration Tools
@ System Tools
二安装前网络环境设定:
node1: 主机名:servers201 ( HA01 )
eth0: 19216810201 //对外IP地址
eth1: 1000201 //HA心跳使用地址
node2: 主机名:servers202 ( HA02 )
eth0: 19216810202 //对外IP地址
eth1: 1000202 //HA心跳使用地址
特别注意要检查以下几个文件:
/etc/hosts
/etc/hostconf
/etc/resolvconf
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/sysconfig/network-scripts/ifcfg-eth1
/etc/nsswitchconf
#vi /etc/hosts
node1的hosts内容如下:
127001 localhostlocaldomain localhost
19216810201 servers201 HA01
1000201 HA01
1000202 HA02
19216810202 server202
node2的hosts内容如下:
127001 localhostlocaldomain localhost
19216810202 servers202 HA02
1000202 HA02
1000201 HA01
19216810201 server201
#cat /etc/hostconf
order hosts,bind
#cat /etc/resolvconf
nameserver 61139269 //DNS地址
#cat /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=servers201 //主机名
GATEWAY="192168101" //网关
GATEWAY="eth0" //网关使用网卡
ONBOOT=YES //启动时加载
FORWARD_IPV4="yes" //只允许IPV4
#cat /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
ONBOOT=yes
BOOTPROTO=static
IPADDR=19216810201
NETMASK=2552552550
GATEWAY=192168101
TYPE=Ethernet
IPV6INIT=no
#cat /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth1
ONBOOT=yes
BOOTPROTO=none
IPADDR=1000201
NETMASK=2552552550
TYPE=Ethernet
[node1] 与 [node2] 在上面的配置中,除了
/etc/hosts
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/sysconfig/network-scripts/ifcfg-eth1
要各自修改外,其他一致。
配置完成后,试试在各自主机上ping对方的主机名,应该可以ping通:
/root#ping HA02
PING HA02 (1000202) 56(84) bytes of data
64 bytes from HA02 (1000202): icmp_seq=0 ttl=64 time=0198 ms
64 bytes from HA02 (1000202): icmp_seq=1 ttl=64 time=0266 ms
64 bytes from HA02 (1000202): icmp_seq=2 ttl=64 time=0148 ms
--- HA02 ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 2002ms
rtt min/avg/max/mdev = 0148/0204/0266/0048 ms, pipe 2
三安装HA 与HA依赖包
rpm -Uvh libnet-1121-1rhelum1i386rpm //可以不装
rpm -Uvh heartbeat-pils-204-1el4i386rpm
rpm -Uvh heartbeat-stonith-204-1el4i386rpm
rpm -Uvh heartbeat-204-1el4i386rpm
rpm -Uvh ipvsadm-124-5i386rpm
四 配置 HA的各配置文件
配置心跳的加密方式:authkeys
#vi /etc/had/authkeys
如果使用双机对联线(双绞线),可以配置如下:
#vi /etc/hcd/authkeys
auth 1
1 crc
存盘退出,然后
#chmod 600 authkeys
配置心跳的监控:haresources
#vi /etc/had/haresources
各主机这部分应完全相同。
server201 IPaddr::19216810200 ipvsadm >双机热备指的是使用2台服务器,通过双机热备软件(HA)来监控应用程序的运行状态,当发现网络、硬盘或系统等原因造成主服务器上运行的应用程序无法正常运行时,会自动将主服务器上的应用程序停止将磁盘资源和虚拟IP资源释放并切换到备用服务器启动相关资源和应用程序。双机热备对于某一个应用程序只能工作在active-standby方式,无法实现集群并行工作,除非是有多个应用人为分配在这2台服务器上,使这2台服务器分别对各自被分配到的应用作为主服务器(Active)。实现双机热备至少需要2台服务器(最好是双网卡)、共享磁盘阵列(如果不采用共享磁盘阵列需双机热备软件支持数据同步复制)、双机热备软件。双机热备主要是针对应用而言。RAID是通过某种算法将多块物理磁盘组成逻辑上的一块磁盘,从而实现大容量、安全性(冗余)、高速度等需求(不同RAID级别的特点不同)。对于数据库冷热备份,你是否指的是数据库数据的备份?冷备是指需要停止数据库后才可以进行数据备份,热备指的是通过SnapShot(快照)技术实现对数据库的在线数据备份。所谓双机热备,就是将中心服务器安装成互为备份的两台服务器,并且在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行。我们来看看在WIN2000服务器版下的实现过程。
一、 硬件准备及基本安装综述
网络服务器 两台
网络服务网卡 四块
服务器硬盘 两块
SCSI磁盘阵列 一个
SCSI硬盘 三块
首先是将两台服务器都配置成双网卡,并分别安装Win2000 Advance Server(高级服务器版)。之后配置网络环境使之畅通:将两台服务器加入到域当中,成为域成员,并在每台服务器上设置管理员权限。
另外就是注意所有磁盘必须设置成基本盘并做成采用NTFS格式分区,磁盘阵列分区一定要大于2个。最后将三块SCSI硬盘做成磁盘阵列,笔者建议为RAID5(在配置阵列时,一定注意单独分一个至少1G的分区出来,用于存放配置数据库的检测点以及日志文件)。
二、 具体安装要点。
配置服务器网络环境要点
1、 在前一步中,我们将两台服务器都安装了双网卡,一个用于连接公网(internet),一个连接内部局域网。
将连接内部局域网的网卡建立点对点的通信和群集状态信号,然后每个终端的公网适配器连接该群集到公网上,并在此驻留客户。
2、 待win2000高级服务器版安装好后,开始配置每台服务器的网络参数。在网络连接将连接公网的改为“外网”,连接局域网的改为“内网”,然后将两台服务器的各自网卡分别指定IP地址为:
服务器A:外网IP为:1921680160,内网IP为:1010101,子网掩码为:2552552550 网关为:19216801(此处网关为你主域控制器的IP地址)
服务器B:外网IP为:1921680161,内网IP为:1010102,子网掩码为:2552552550 网关为:19216801
安装服务软件要点
配置服务器A
1、 所有的设备都先关闭后再开启磁盘阵列。
2、 启动服务器A,用事先设置的管理员帐号登陆到域;然后在添加/删除程序选项里添加“集群服务”组件,并注意在安装过程中将此组件设置为集群的首节点,接着创建集群名称(任取即可,比如
myserver)。
3、 由于我们只有一个共享的磁盘阵列,所以应该将此阵列中的分区都配置成群集磁盘。
4、 开始配置群集网络。外网和内网的配置相同,即群集网络的外网、内网的名称和IP地址要保持跟网络适配器一致,至外还要选中该网络可用于集群服务,外网要选中所有的通信(混合网络)选项,而内网只选中用于内部群集的通信选项。在接着出现的“使用网络顺序”对话框中,调整为表里的第一个连接是内网(解释:在正常的 *** 作中,该连接将用于群集通信。如果此连接失效,群集服务将自动切换到表里的下一个网络),继续下一步会出现集群的IP地址和掩码选项,设置集群IP地址为1921680162,子网掩码为:2552552550。单击完成即可。
配置配置服务器B
首先一定保持磁盘阵列和服务器A的开机和可用,然后才启动服务器B。接着同样安装“集群服务”组件,安装过程大致与服务器A相同,唯一注意的地方是在创建或添加群集的对话框中,在群集中选择第二个或下一个节点,并单击下一步;接着输入前面所创建的群集名称(本例为myserver),在下一步中将连接到群集设为未选中,这样群集服务配置向导会自动提供前面在安装服务器A时选定的帐号名,输入该帐号的口令后一路点击下一步并最终结束配置。
最后我们应检测以上 *** 作是否成功。依次单击“开始”—“程序”—“管理工具”,打开“群集管理器”,如果看到显示有这两个节点,表明群集已被正常配置并已开始运行。
三、 功能检测。
我们主要来看看它的容错能力,以下是笔者的一些检测:
1、 在两台服务器以及集群服务同时运行的情况下,断掉其中一台服务器的外网连接,此时运行在此服务器上的集群服务会被迫自动断开并转移到另外一个连接正常的节点上(此过程所需时间视你服务器开展的服务数量而定,一般4秒钟左右)。或是可以更改一台服务器的系统时间,经过几分钟,被改动的时间会自动调整成同另一台节点相同。
2、 在集群服务上开启web服务,并设置好下载项目。在用户端开始下载项目,接着马上断掉集群中的一个节点,结果用户端并无明显的感觉掉线!
由以上检测办法可以看出,Win2000服务器版的集群服务在容错方面具有良好的表现!一般在瞬间即可把出错的节点上的服务接管过来,而用户端并不会感觉有明显的变化!双机热备 共享存储方式什么是双机热备
双机热备包括广义与狭义两种。
从广义上讲,就是服务器高可用应用的另一种说法,英译为:high available,而我们通常所说的热备是根据意译而来,同属于高可用范畴,而双机热备只限定了高可用中的两台服务器。热备软件是用来解决一种不可避免的计划和非计划系统宕机问题的软件解决方案,当然也有硬件的。是构筑高可有集群系统的基础软件,对于任何导致系统宕机或服务中断的故障,都会触发软件流程来进行错误判定、故障隔离、以及通地联机恢复来继续执行被中断的服务。在这个过程中,用户只需要经受一定程度可接受的时延,而能够在最短的时间内恢复服务。
从狭义上讲,双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备,双机高可用按工作中的切换方式分为:主-备方式(Active-Standby方式)和双主机方式(Active-Active方式),主-备方式即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。
注:Active-Standby的状态指的是某种应用或业务的状态,并非指的是服务器状态。
组成双机热备的方案主要有两种方式:
1、基于共享存储(磁盘阵列)的方式:
共享存储方式主要通过磁盘阵列提供切换后,对数据完整性和连续性的保障。用户数据一般会放在磁盘阵列上,当主机宕机后,备机继续从磁盘阵列上取得原有数据。如下图所示。
这种方式因为使用一台存储设备,往往被业内人士称为磁盘单点故障。但一般来讲存储的安全性较高。所以如果忽略存储设备故障的情况下,这种方式也是业内采用最多的热备方式。
2、基于数据复制的方式:
这种方式主要利用数据的同步方式,保证主备服务器的数据一致性。
数据同步方式
基本于数据复制的方式有多种方法,其性能和安全也不尽相同,其主要方法有以下几种:
A、单纯的文件方式的考贝不适用于数据库等应用,因为打开的文件是不能被复制的,如果要复制必须将数据库关闭,这显然是不可以的。以文件方式的复制主要适用于WEB页的更新,FTP上传应用,对主备机数据完整性,连续性要求不高的情况下使用。
B、利用数据库所带有复制功能,比如SQLServer2000或2005所带的定阅复制,这种方式用户要根据自己的应用小心使用,原因主要是:
(1)SQLServer的定阅复制会在用户表上增加字段,对那些应用软件编程要求较高,如果在应用软件端书写时未明确指定字段的用户,而使用此功能会造成应用程序无法正常工作。
(2)数据滞留,这个限制怕也是最要命的,因为SQLServer在数据传输过程中数据并非实时的到达主备机,而是数据先写到主机,再写到备机,如此一来,备机的数据往往来不及更新,此时如果发生切换,备机的数据将不完整,也不连续,如果用户发现已写入的数据在备机找不到,重新写入的话,则主机修复后,就会发生主备机数据严重冲突,数据库会乱掉。
(3)复杂应用切莫使用定阅复制来做双机热备,包括数据结构中存储过程的处理,触发器和序列,一旦发生冲突,修改起来非常麻烦。
(4)服务器性能降低,对于大一点的数据库,SQLServer2000或2005所带的定阅复制会造成服务器数据库运行缓慢。
总之SQLServer2000或2005所带的定阅复制主要还是应用于数据快照服务,切莫用他来做双机热备中的数据同步。
C:硬盘数据拦截,目前国际国内,比较成熟的双机热备软件通常会使用硬盘数据拦截的技术,通常称为镜像软件即Mirror软件,这种技术当前已非常成熟,拦截的方式也不尽相同。
(1)分区拦截技术,以Pluswell热备份产品为例,他采用的是一种分区硬盘扇区拦截的技术,通过驱动级的拦截方式,将数据写往硬盘的数据提取,并着先写到备用服务器,以保证备用服务器的数据最新,然后再将数据回写到主机硬盘。这种方式将绝对保证,主备机数据库的数据完全一致,无论发生哪种切换,都能保证数据库的完整性与连续性。由于采用分区拦截技术,所以用户可以根据需要在一块硬盘上划分适合大小的分区来完成数据同步工作。
(2)硬盘拦截技术,以Symantec的Co-Standby为例,也是一种有效的硬盘拦截软件,他的拦截主要基于一整块硬盘,往往在硬盘初始化时需要消耗大量的时间。
双机热备中需要指出的几个概念:
1、双机热备的工作原理即:故障隔离,简单的讲,高可用(热备)就是一种利用故障点转移的方式来保障业务连续性。其业务的恢复不是在原服务器,而是在备用服务器。热备不具有修复故障服务器的功能,而只是将故障隔离。
2、Active-Active方式指的是业务方式而不是服务器状态,如果是同一种应用是不能完成Active-Active方式的。例如热备的两台服务器都是sqlserver数据库,那也是指的不同的数据库实例。相同的数据库实例是不可能在热备这一级实现Active-Active方式。简单的讲Active-Active方式就是两个Active-Standby方式分别运行于两台服务器上的。
3、故障检测:故障检测是双机热备的任务,不同的双机检测点的多少决定了双机热备软件在功能和性能上的优劣,并不是所有的软件都具有相同的检测功能,以PlusWell双机热备软件为例,其提供的是一种全系统检测能力,即检测分为系统级、应用级、网络级三个方面。系统级检测主要通过双机热备软件之间的心跳提供系统的检测功能,应用级提供用户应用程序、数据库等的检测功能,网络级的检测提供对网卡的检测及可选的对网络路径的检测功能,因此称为全故障检测能力。
4、服务器资源,双机热备的资源指某种业务运行过程中所依赖的最小的关联服务,不同的双机软件所提供的资源多少也不相同,当然提供的可切换资源越多,软件应用的范围也越广,在双机热备中提到的服务器资源主要包括,可切换的网络IP资源、计算机名、磁盘卷资源、服务器进程等。
5、双机热备的切换,双机热备的切换一般分为手动切换和故障切换,即计划性切换(即人为切换)和非计划性切换(即故障切换)。需要大家注意的是并不是所有资源都具有可切换性,以PlusWell热备份软件为例他提供了:(1)本地资源监控,即不可切换的资源,(2)普通资源,即可以在主备机切换的资源。(3)快速资源,指的是快速切换的资源,
一般情况下的双机切换时间为1-5分钟,而快速切换的时间为3-5秒种。用户应根据自己的需求及业务特点来选择相关的切换服务,从价格成本上来说,切换的时间越短费用也越高。
6、热备份与备份的概念区别,热备份指的是:high available即高可用,而备份指的是Backup,即数据备份的一种,这是两种不同的概念,应对的产品也是两种功能上完全不同的产品。热备份主要保障业务的连续性,实现的方法是故障点的转移,而备份,主要目的是为了防止数据丢失,而做的一份考贝,所以备份强调的是数据恢复而不是应用的故障转移。NEC ExpressCluster® X 30 纯软热备方式简介
1 概述
信息化建设的不断推进,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用,一旦发生宕机故障或应用停机,将给机构带来巨大的经济损失。
可见,对那些需要保障信息安全和提供不间断的信息服务的机构来说,业务系统的容错性和不间断性显得尤为重要。如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。
2 软件功能简介
荟萃NEC技术精华的EXPRESSCLUSTER是一款专业的高可用集群软件产品(双机热备集群软件),可为您提供Windows和Linux平台上完整的高可用性解决方案。当集群中的某个节点由于软件或硬件原因发生故障时,集群系统可以把IP、客户业务等资源切换到其他健康的节点上,使整个系统能连续不间断的对外提供服务,从而为机构24x365的关键业务提供了可靠的保障,达到了系统99999%的高可用性和可靠性。
NEC ExpressCluster® X 30 语言支持:中文、英文、日文。
NEC ExpressCluster® X 30 最大节点数:
支持2~32节点
NEC ExpressCluster® X 30 配置信息备份:集群配置信息可以导入、导出。配置好NEC软件之后可以选择导出配置文件保存,如果出现系统宕机,无需重新配置NEC软件,即可恢复集群,可以通过导入配置文件,快速建立双机系统;对于系统更改主机名,IP地址等相应的信息,只需简单 *** 作就可以完成NEC软件系统的修改。
NEC ExpressCluster® X 30 报警功能:
不仅有event log输出、AlertView显示、还支持手机短信、Email、旋转灯方式的通报功能。
NEC ExpressCluster® X 30 BS架构管理工具:
实现了Windows和Linux两个平台上的产品的管理接口的统一。完全屏蔽了平台差异性。
只要有浏览器和Java运行环境,任何一台机器都可以进行监控,维护和配置 *** 作。
可以在一个页面上同时显示多个集群的状态, 无论是Windows集群还是Linux集群,一目了然。
NEC ExpressCluster® X 30 日志收集功能:
提供log自动收集工具,可在管理控制台自动收集所有集群服务器的日志信息,并且可供收集的log种类丰富,除了EC本身的内部日志以外,还可收集系统日志、注册表信息、系统诊断报告等等
NEC ExpressCluster® X 30 故障监视功能:
可以对主机的网卡、本地磁盘、存储、应用程序、进程、服务、 *** 作系统、服务器自我监视等。当主机发生任何故障后,NEC ExpressCluster® X 30将自动、快速的把主服务器上的所有资源切换到备服务器上,确保应用程序持续可用性,保证公司业务的持续运行。
NEC ExpressCluster® X 30 的集群结构:
共享磁盘型、数据镜像型、共享磁盘镜像型、虚拟平台集群、无磁盘型、共享和镜像共存型、NAS型。
NEC ExpressCluster® X 30 的运行方式支持:
Active/Standby 、Active/Active、N+1备份、M+N备份和远程集群:
Active/Standby:其中一台服务器作为 Active 主机,运行重要的应用程序,向客户端提供各种应用服务,另一台服务器作为备机,实时监控 Active 主机运行情况,只有当 Active 主机发生故障后,备机才接管 Active 主机上的应用服务。
Active/Active :每台主机上运行各自的应用程序。服务器在运行自身的应用服务时,同时也是另一台主机的备机,即两台主机互为备机。
N+1备份:有N台主服务器上运行各自的应用程序,1台服务器做为这N台主服务器的备服务器;当有任何一台主服务器发生故障,这台备服务器就会接管此主服务器上的应用程序。
M+N备份:有M台主服务器上运行各自的应用程序,N台服务器做为这M台主服务器的备服务器;当有任何一台主服务器发生故障,这N台备服务器中对应的那台应用服务器就会接管此主服务器上的应用程序。
远程集群:两座城市之间对应用程序做高可用保护,只有一座城市的应用服务器运行此应用程序,当此应用程序出现故障,另一座城市的服务器马上接管此应用程序。
NEC ExpressCluster® X 30 解决方案:
双机双柜(数据镜像型)、双机单柜(共享磁盘型)、双机无柜(数据镜像型\无磁盘型)、多机单柜(共享型)等等。
NEC ExpressCluster® X 30 支持的 *** 作系统:
windows、linux等等。
NEC ExpressCluster® X 30 支持的数据库:
oracle、mssql、sql server、DB2、sybase等等。
NEC ExpressCluster® X 30 支持的应用程序:
如web、his、lis、pacs、erp、收费、语音、视屏等等,所有的应用程序都支持。1,就算两台服务器品牌配置型号都不同,也可以做双机热备
2,如果双机热备成功做成,对系统没有影响
3,如果使用磁盘阵列柜,不需要第3方软件 2003有带集群功能
4,所需要的硬件是:磁盘阵列柜一个 SCSI卡两块 SCSI线两根 (连接磁盘阵列柜),双机都要双网卡(一块连局屿网 一块双机对连)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)