今天一大早接到一个客户的电话,说企业有些客户不能上网浏览。登录检查后发现一个存储的控制器损坏了。主要原因简述如下。
目前,客户的关键业务流程在vSphere虚拟化技术服务平台上运行。这家企业有三台惠普服务器和一台IBM3524存储,服务器和存储通过SAS接口连接。其中,两台惠普服务器通过SAS电缆连接到A控制器,另一台惠普服务器通过SAS电缆连接到B控制器。服务器和存储之间没有冗余连接。三台惠普服务器配备ESXi6.0asHA,所有vm虚拟机都存储在IBM3524存储中。在A控制器被销毁后,前两个HP服务器失去了与存储的连接,导致一些vm虚拟机无法启动。由于两个服务器在HA中被破坏,HA无效。了解原因后,让客户将一台惠普服务器的SAS线缆连接到B控制器剩余的端口号空(现在IBM3524有两个控制器,每个控制器有两个SAS接口,所以B控制器现在有剩余的端口号空),重启这台服务器。这时两台服务器会正常工作,然后启动业务流程vm虚拟机。
业务流程修复后,因为今天的存储已经超保了,所以我申请买了一个新的同样的控制器。控制器交付后,我拆除并更换了损坏的控制器。在整个拆换过程中,我发现8号槽的硬盘要失效了。拆换了控制器之后,我也换了会失效的硬盘。下面简单介绍一下关键的整个过程和流程。
(1)进入IBMDSStorageManager管理系统软件,可以看到A控制器已经离线,有两个五星符号为XXX的磁盘,如图1-1所示。
图1-1已经离线。
【说明】今天的方案中,第3槽和第8槽都是五星符号,分别为《××年×月×日×月×日×月×日×月×日×月×日×月×日×月×日×日×月×日×月×日×日×月×日×日×月×日×日×月×日×月×日×日×月×日×日×月×日×日×日×月×日
(2)在对“恢复大师”的进一步检查中,发现第八盘的硬盘会失效,存在内容丢失的风险,如图1-2所示。
图1-2插槽8硬盘
(3)从仓库中取出损坏的控制器,并更换货架上购买的控制器。
(4)在存储系统中,右键单击控制器A,在d出的便捷菜单中选择“高级→放置→联机”将其置于联机状态,如图1-3所示。
图1-3将控制器放在线上
(5)控制器在线,如图1-4所示。
图1-4控制器线
但是,控制器联机后,连接到控制器A的服务器找不到LUN。进一步检查发现控制器A的flash不对,如图1-5所示。
图1-5一个控制器的闪光情况不对
有可能是在控制器从快递公司退货的整个过程中,控制器中的SD卡(一个8GB的缓存卡)因为晃动或者其他原因松动或者出现了一些问题。将新安装的控制器设置为“离线”,打开控制器,将之前被破坏的控制器的SD卡插入新购买的控制器。
(6)右键单击控制器A,在d出的便捷菜单中选择“高级→放置→离线”,将其置于离线状态,如图1-6所示。
图1-6:使控制器脱机
(7)在d出的“确认下线”提示框中点击“是”按钮,如图1-7所示。
图1-7确保它被设置为脱机。
(8)当控制器A离线时,取下控制器,如图1-8所示。然后更换原来破坏控制器的SD卡,重新插上控制器。
图1-8控制器离线。
(9)再次将控制器设置为在线状态,然后看到SD卡处于正常状态,如图1-9所示。
图1-9控制器正常。
此时,连接到控制器A的服务器应该能够发现存储分配的LUN,如果它不能发现LUN,它可以在“存储和复制服务”中发现,右键单击LUN并在d出的方便菜单中选择“更改→所有权/首选路径”,并选择“插槽A中的控制器”,如图1-10所示。
图1-10将LUN分解到控制器
对于面板8将失效的硬盘,可以置为“失效”,然后换成热备硬盘,然后在面板8中更换新的硬盘。关键流程如下。
(1)右键单击插槽8的硬盘,在d出的便捷菜单中选择“高级→失败”,如图1-11所示。
图1-11设置硬盘不成功
(2)在d出的“确认驱动器故障”提示框中,键入yes然后单击“确定”按钮,如图1-12所示。
图1-12确认设置
(3)右键单击Slot6(该面板的硬盘为热备盘硬盘),在d出的便捷菜单中选择“热备盘覆盖”,如图1-13所示。
图1-13热备硬盘改造
(4)在d出的"热备盘驱动器选项"提示框中选择"自动分配驱动器",然后点击"确定"按钮,如图1-16所示。
图1-16自动调度控制器
(5)在“更换驱动器”提示框中,将显示更换插槽8到插槽6的无效硬盘的信息,如图1-17所示。
图1-17更换控制器
(6)返回“存储和复制服务”提示框,访问LUN可以看到逻辑硬盘将被重建,如图1-18所示。当时是10点02分。
图1-18硬盘重建
(7)此时,可以将面板8的硬盘拆下,换上同容量的新硬盘。进行图1-18的重建后,面板8的硬盘将被更换并带回家,如图1-19所示。此时,8号面板的硬盘有一个×××五星标志,而6号面板的硬盘有一个鲜红的十字标志。
图1-19更换硬盘
(8)在“存储”中,“拷贝服务”的提示框访问所涉及的LUN,可以看到这种情况变为“拷贝回进度数据不可用”。当前获取的时间是22:23,整个复制的过程大约是60%,如图1-20所示。由于更换8号槽的时间是早上10点左右,所以到现在大概有12个小时了。因此,完全移除和更换硬盘大约需要15个小时。
图1-20复制的整个过程
(9)第二天早上7:33检查,复印进度已经做好,如图1-21。
图1-21复制
(10)点击“硬件”菜单栏中的Slot8,可以看到今天的硬盘已经被分配到Array-2,原来的Slot6仍然成为热备硬盘,如图1-22所示。所有的维护都将在这里进行。
图1-22系统状态正常。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)