可以根据企业的具体要求,配置一台可靠而高效的计算机网络服务器。如果企业机构很重要,比如银行、咨询公司、警察部门或企业公司,服务器可靠性方面 的成本就要增加。计算机网络涉及数量众多的部分,比如集线器、路由器、网关、网桥、综合业务数字网络(ISDN)适配器、调制解调器、收发器、防火墙及其 他许多部件;所有这些设备都多多少少依赖服务器来共享数据和资源。服务器的可靠性牵涉诸多子系统。下面是根据贵企业的要求组建一台安全、高性能的服务器时 所要注意的方法和建议。
1 硬盘子系统的可靠性
容易出现故障的服务器部件主要是存储服务器数据的硬盘。硬盘是服务器中的一个机械部件。在选择磁盘驱动器时,你应该考虑SMART(自监测和报告 技术)。这项技术可以监测磁盘驱动器的工作参数,还能够预测磁盘驱动器何时出现故障。大多数服务器厂商都提供热交换磁盘驱动器,这意味着服务器在工作模式 下,就可以更换磁盘驱动器。为了提供容错机制,就要实施RAID(廉价磁盘冗余阵列)。只要在服务器中安装RAID磁盘控制器,就可以实施RAID。 RAID 5提供容错机制的手段是,数据写入到磁盘驱动器上时,添加数据的奇偶校验信息。万一磁盘出现故障,这种奇偶检验信息就可以用来重新生成数据。要实施 RAID 5(带奇偶校验的条带集),至少需要3只磁盘驱动器;RAID5中所用的磁盘数量最多达到32只。
2 服务器处理器
大多数服务器使用性能和处理速度非常可靠的英特尔处理器。处理器是任何服务器的核心部件;要是它无法正常工作,服务器就无法工作。如今出现的趋势是,使用 双处理器服务器,甚至是更多处理器的服务器。在这种情况下,要是某个处理器停止工作,服务器中的其他处理器不受影响。所以说,网络管理员使用多处理器服务 器是最明智的决定。
3 网络子系统
把服务器连接到网络上的工作由网卡适配器来负责。如果服务器的网卡无法正常工作,服务器与网络中其他计算机的连接也就随之中断。许多服务器支持冗余网卡, 可以实施到故障切换或负载均衡环境下。在网卡故障切换环境下,一块网卡用来与服务器进行通信,另一块网卡处于备用状态;一旦另外一块网卡出现故障,第二块 网卡就自动激活。在网卡负载均衡情况下,两块网卡都被激活,因而提高了服务器通信的可靠性和性能。PCI热交换插槽允许在不用关闭服务器的情况下,就可以 更换出现故障的网卡适配器。
4 集群
可通过集群技术来获得冗余机制。在集群环境中,两台或多台服务器作为单一服务器来运行,其中一台服务器出现故障并不影响其余服务器的工作。集群环境具有诸多优点,比如计算环境具有可靠性、负载均衡和高性能等优点。
5 内存性能
内存技术在不断改进,很少出现内存失效的情况。对于系统网络管理员来说,为服务器购买支持ECC(纠错码)的内存是最明智的决定。ECC技术能够检测和纠 正单一比特错误,并且报告多比特内存错误。服务器需要大容量内存,才能顺畅地执行功能。如果服务器的内存容量不高,就会导致启动速度慢、响应时间长和系统 暂停,所以内存对计算机服务器来说很重要。
6 电源系统
许多计算机随带多个电源系统,这些多电源系统分担计算机服务器的电力负载。多电源系统的主要优点在于,一个电源系统出现故障后,不会引起服务器关机,因为 其他电源系统接过了全部的电力负载,所以服务器可以毫无问题地正常工作。与服务器中的其他热交换硬件一样,多电源系统也是热交换的。这意味着,可以在服务 器运行时,将出现故障的电源系统换成新的电源系统。
7 UPS(不间断电源)功能
万一出现停电时,UPS即不间断电源系统起到非常重要的作用。UPS通常可以提供三四个小时的备用电,在这段期间,很容易设置服务器来保存数据,而网络上 的所有用户也可以访问他们存储在服务器上的重要数据。服务器的关闭过程由安装在服务器的软件来控制。UPS在网络环境中非常重要;要是网络中有多台 UPS,它们可以分担负载,为服务器提供不间断电源。
8 备用发电机
需要服务器全天候运行时,比如托管服务器、网站服务器、电子邮件服务器和数据服务器,备用发电机就必不可少。备用发电机通常靠柴油发动,世界上许多知名公 司研发备用发电机,如Jubaili Brothers和康明斯(Cummins)。这些备用发电机可以设成一旦停电,就能自动开启;或者在UPS电量用尽后,就投入使用。
9 冷却风扇功能
处理器里面安装了数量众多的硬件,所以处理器里面要有冷却系统。服务器的冷却工作由冷却风扇来负责,冷却风扇安装在处理器里面。这些冷却风扇往处理器里面 扇入冷空气,将热空气从处理器里面扇出。服务器里面的冷却风扇出现故障会导致服务器自动关闭,那是由于服务器积聚了很高热量。许多厂商提供热交换冷却风 扇。
10 计算机监测硬件
有一种特殊架设的适配器可用来监测服务器中不同部件的性能。有了这种适配器,可以本地监测服务器,也可以通过调制解调器实现远程监测。在非常重要的网络环境下,这些类型的适配器通常用于服务器,以监测不同网络设备的性能。
11 计算机服务器软件
安装在服务器上的软件应该非常可靠、没有病毒。应该安装和更新一款优秀的反病毒软件,比如诺顿、趋势科技、迈克菲、Panda或其他任 何反病毒软件。另外,还应该安装一款优秀的防火墙以及反间谍软件、恶意软件和广告软件产品,让服务器远离病毒或间谍软件。还应该在服务器上安装优秀的备份 软件,以防出现任何意外情况。任何不需要的软件、媒体播放器、编解码器、Flash游戏或电子邮件都为互联网上的病毒进入贵企业网络上提供了可趁之机。不 该将任何未经授权的应用软件或硬件安装到服务器上。如果病毒进入到了服务器上,就很容易通过网络来传播;如果病毒的性质很恶劣,甚至还会破坏你的所有重要 数据。对于为计算机网络架设一台安全、可靠的高性能服务器,架设优秀服务器的上述建议可以起到重要作用。
12 数据服务器位置
服务器应该放在能够为服务器提供冷却、无尘环境的机房。强烈建议:服务器机房应该做到非常安全;只有授权人员(如网络管理员或其他用户)才可以进入到服务器机房。
通常DNS服务器未响应,是由于网络连接不可用造成的。因此首先解决网络连接的问题其次就是dns被劫持导致的,可以使用电脑管家修复下看看可否解决。
但是如果DNS服务器不在你内部网络上,你需要先确定是不是整体网络的问题。不排除是路由DNS释放失败,导致给你提供的DNS服务器地址错。
dns网络服务器的原理:
客户端发起一个DNS解析请求,若本地DNS服务器若不能为客户端直接解析域名,则域名服务器会代替客户端(下级服务器)向域名系统中的各分支的上下级服务器进行递归查询,直到有服务器响应回答了该请求后,将该请求结果返回客户端。在此期间,客户端将一直处于等待状态。
服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。有一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module (VRM) over/under-voltage 288V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASHEXE,然后将从网上下载的LH6KCBIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH /CMC A:LH6KCBIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。
任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种 *** 作系统下的驱动程序,方便了客户在各种 *** 作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。
相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。
这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER 2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。
在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windataexe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随 *** 作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障, *** 作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误 *** 作(包括没按 *** 作流程的 *** 作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误 *** 作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。
正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用规则。
这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它 *** 作系统均有效)。
正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才能使系统进入正常的关闭过程中。
另外,为了避免数据丢失,你应该按照如下的步骤 *** 作:
· 经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。
· 安装第二块硬盘并与原来的硬盘设置成镜像,
一旦Server Apliance未能正确关闭,并无法重起,请按如下 *** 作恢复:
1 当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。
2 连接串口线的另一头到一台运行Windows的PC的串口上。
3 运行超级链接程序(HyperTerminal),并设置端口的参数为19200, n-8-1, Flow control - None 你可以看到appliance的控制提示,并要求你输入管理员口令。
4 重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。
5 敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。
6 在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)
翻至Defaults… 并按右箭头键选中。
翻至Root Password…并按右箭头键选中。
翻至Random 并按右箭头键选中,会提示一个随机产生的密码。
记下此密码。
翻至Yes并按右箭头键选中,系统密码会立刻更改。
7 回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。
8 为修复分区,请按如下方法 *** 作:
对于sa1100,按顺序输入:
[…]#: fsck /dev/hda5
[…]#: fsck /dev/hda6
[…]#: fsck /dev/hda7
对于sa1120,按顺序输入:
[…]#: fsck /dev/sda5
[…]#: fsck /dev/sda6
[…]#: fsck /dev/sda7
当所有的分区都被修复后,应回到“#”提示符下。
9 输入“reboot”重新启动系统。
如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。
对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。如果你的空间服务商频繁地、不定期地通知您修改域名解析的指向IP,或者干脆强制您必须使用cname方式解析您的域名,那么你就要留意了。这种情况一般发生在使用海外服务器上,原因可能有二:1、IP被封——服务器IP在国内被封,无法正常访问了; 2、服务商更换服务器。
其中第二项即服务商更换服务器这种情况比较少见。一般来说,出现这种情况多见于该服务器是个人方式运营的,或运营海外主机没多久的网络公司。
而对于第一种原因,则是几乎所有海外服务商都会经常发生的事情。海外空间运营绝不同于国内虚拟主机方式,没有相当的海外主机运营经验,绝对是很难做好海外主机服务的。
这里的IP被封仅仅限于在中国大陆范围内,即被封的只是中国大陆,大陆之外访问完全正常。
那么为什么会频频被封呢究其原因主要是服务商缺乏内容管理大陆的互联网环境已经基本很干净了,而大量的非法网站在国内没有了出路,就只有另寻捷径,把网站放置到中国以外的地方去。
于是乎大量的个人非法类网站,。懂英语的会找海外本土的大服务商,比如著名的Godaddy。但是,这仍然存在问题:海外本土服务商的无法运行他们的网站,主要表现是乱码、功能不正常,这是由于其字符集引起的。
这样,90%的国内非法网站运营便会咨询中国本土的海外主机运营商,而问题是几乎所有的运营商都没有对网站内容进行定期检查与管理,更谈不上采用非法内容拦截系统。
这样的直接后果便是,中国GFW检测到国际出口带宽上的非法内容时,便会将相应的IP给封掉(Block),这样中国大陆以内便无法再访问这个IP上的所有网站。
这就是您的海外网站频繁被通知换IP的原因。
那么更换IP对您的网站是否有影响呢
搜索引擎如百度、谷歌、搜狐、MSN Live等,当发现您的网站更换了IP后,便会对您的网站进行重新索引,造成短时间内的收录减少,排名下降! 简单些说,经常更换IP,说明您的网站不稳定,不值得搜索引擎信任!
尤为严重的是,当更换后的IP被上述搜索引擎列入作弊黑名单时,您的网站将会失去所有的收录和收录机会,搜索引擎中完全搜索不到您的网站,您的网站将变成一个孤岛!
所以使用海外主机的朋友一定要注意选取一个有经验的、比较著名的大服务商,尽量避免上面的情况出现。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)