IBM power4(5)系列的设备上的黄灯(系统警告灯)长亮,并不一定是硬件报错。引起此种现象有多种原因,可能是由于硬件故障,也可能是由于机房环境(如电流,温度,网络断线),也可能由于用户的误 *** 作(如非正常关机,等等)引起。
其判别方法如下:
1,诊断系统,判断是否硬件故障。
Root用户执行diag;
回车后,进第2项,advanced diagnostics routines;
选system verification;
选all resources,回车;
按F7进行执行检测;
看返回结果,是否存在故障。
如存在故障,记录故障及errpt –a,反馈给IBM公司或维护商。
2,如无故障。清除警告灯。
Root用户执行diag;
回车后,进第3项,task selection;
选Identify and Attention Indicators;
Set System Attention Indicator to Normal,回车;
按F7进行执行。
1、查找在AIX上清除黄灯(报警)的方法。
方法1、diag =>task =>log repair action => sysplanar0, enter,F7
方法2、用串口进入ASM
问题描述:如何熄灭故障报警灯
解答:
在日常工作中,有时会遇到机器面板上的橙色有感叹号标示的硬件故障报警灯亮的情况。硬件故障报警灯是一个发光二极管,它亮表示系统检测到了硬件故障,管理员应该注意。但是硬件故障报警灯是非常敏感的,很多情况下并不是硬件产生了故障它才亮,例如热插拔某些信号线或者电缆,用户非正常关机等都可能导致该警报灯亮。此时,管理员应该首先检查系统错误日志errpt,看一下是否真的有硬件错误。如果没有,那么我们可以先将这个灯熄灭,如果真的有硬件上的故障,它会再次亮的。
熄灭故障报警灯有多种方法,普通用户常用的是用命令行方式或者用HMC。
在命令行方式下,运行diag命令:
diag
-> 回车
->Task Selection
-> Identify and Attention Indicators
->回车选择 Set System Attention Indicator to NORMAL
->F7 提交,OK
在HMC控制台上:
选择左列的“Serivce Applications”
->Serivce Focal Point
右侧的LED Management中您可以看到LED State,右键可以把它从On状态变到Off状态。
##注意:报警肯定是有原因的,为了生产环境的安全,请分析过报警信息后再做日志的清理和报警灯的关闭!!
一、HMC的WEB页面下的 *** 作。
登陆HMC;
找台笔记本网卡配置IP 1921680144(不限于144,只要是1921680网段非147即可),用网线连接小型机后面HMC的上面的1网口,从IE地址栏中输入>
那个是系统错误指示灯
出现这个表示你的机器有故障 建议拉出控制板
查看上面是否有其他灯亮起
指示灯
描述
OVERSPEC
没有足够的电量为系统供电。NONRED和LOG指示灯可能也点亮
PS
一个电源故障或者被电源未插
LINK
保留
CPU
CPU出现故障、丢失或者未正确安装
VRM
直流电-直流电稳压器丢失或者故障
LOG
BMC日志或者系统错误日志满(系统错误日志达到75%满)
MEM
内存故障
NMI
系统已收到一个硬件错误报告。(PCI和MEM指示灯也可能点亮)
PCI
PCI适配器出现故障
SP
Remote Supervisor Adapter II SlimLine中出现故障
DASD
硬盘出现故障或者被卸下
RAID
RAID适配器出现故障
NONRED
服务器使用非冗余电源或者其交流电源出现故障,系统将超出规范。
TEMP
系统温度或者组件超出规范。(风扇FAN可能也被点亮)
FAN
风扇出现故障或者被卸下
PCI
BRD
PCI-X板出现故障
CPU
BRD
CPU托盘出现故障
I/O
BRD
I/O板出现故障
叹号灯亮说明有硬件故障,需要注意。低端的一路和两路服务器只有叹号灯来提示硬件故障,发现后需要在uefi内查看日志或开机箱检查,两路或以上的有光诊断面板的机型很方便,发现叹号灯亮后,d出光诊断面板即可查看是什么硬件故障,相应硬件上方的led灯会点亮,如ps是电源,brd是主板。
眨眼间,您可能就会错失良机,新技术正在以前所未有的速度引发商业领域的变革。您该如何找到时间和资源来推动所必需进行的创新,从而使您的组织在不断快速变化的市场中保持竞争优势?如何才能更快速地响应业务需求?现在正是重新考虑IT 服务交付的最佳时机。IBM®:新企业数据中心战略可帮您的公司克服面临的诸多运营难题,以变得更集成、更高效、更动态、对客户的响应能力更强。通过使技术和业务保持一致,IBM可为人提供创新乃至在竞争中保持领先地位所需的自由度和工具。
随着技术在各行各业的核心地位日益增强,IT 专业人士在管理不断扩大的、复杂的分布式基础架构,和爆炸式增长的信息上所花费的时间也越来越多,同时,他们还要努力快速响应业务和法规要求。包括成本、服务交付和信息风险管理在内的诸多运营问题令众多IT 部门不堪重负。此外,持续攀升的电力成本和企业指导方针也要求企业变得更加节能。
同时面临所有这些挑战,企业往往很难抽出必要的时间和资源来评估和利用新技术,以简化IT 运营、响应法律和法规要求,并保持公司的竞争力和盈利能力。而且您的公司承担不起创新机会溜走的损失。信息速度与可用性的增长,创造了跨网络集成服务,以及对分布式IT 资源集中整合的新机遇。我们有望快速访问可信的信息、实时的数据和分析内容。数据中心将愈加强大,并要求系统、数据、应用程序和网络始终保持高可用性、高安全性和高灵活性。
您的组织要想应对这些挑战,只凭更优良的设备远远不够。要在Web 20时代保持竞争优势,业务及IT 负责人必须采取全新的方式来访问数据中心。为更好地支持业务需求,数据中心必须利用新经济来提升IT 效率、支持快速部署新应用程序、以服务的方式交付IT 成果、实时分析和整合信息。这些新要求使IT 能够随时、随地、并以用户想要的查看方式提供信息。
把旁边的光通路诊断卡抽出来看看,对应的报错代码含义如下:ps 指示灯:当此指示灯发亮时,表明电源2 出现故障。
temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。
fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。风扇发生故障还会导致over temp 指示灯发亮。
link指示灯:当此指示灯发亮时,网卡出现故障。
vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。
cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。
pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。
mem 指示灯:当此指示灯发亮时,表明发生内存错误。
dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。
nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。
sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。
brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。
log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。
cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误
。
raid 指示灯:当此指示灯发亮时,表明阵列卡故障。
over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。
remind 按钮:按下此按钮可重新设置 *** 作员信息面板上的系统错误指示灯并将服务器置于提醒方式。在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)