更换VA 7100阵列控制器过程全记录

[复制链接]
nas

该用户从未签到

22

主题

1

回帖

268

积分

[INTOHARD]排长

Rank: 3Rank: 3

积分
268
发表于 2006-12-25 19:50:58 | 显示全部楼层 |阅读模式
  症状为阵列2号控制器亮controller黄灯,根据经验一看就知道2号控制器挂了。今天的任务是要帮客户更换7100的控制器。

1、备份ORACLE数据库(1个全库exp+1个全库冷备份)
2、备份阵列盘上其他的文件系统和LUN、VG、PV、LV的名称和大小等信息。其实就是把diskinfo,ioscan,vgdisplay等命令结果保存下来。
3、umount 所有文件系统,vgchange -a n 所有阵列上的VG。这步非常重要,强烈建议。
4、VA7100支持热插拔和shutdown后更换两种方式,我用的热插拔方式,service guide里说用后者可能使阵列无法启动。
5、阿拉小心换下已牺牲的2号磁盘控制器(热插拔),等了两分钟插上新控制器,阵列上正常的那块控制器FW是HP19的版本,service guide上说HP14以后的版本都会自动去同步FW。于是等了20多分钟,客户都等的着急了,2号控制器的DIMM1指示灯仍迟迟不亮,无法用console连上,看来service guide里面说的也不能全信。
6、我用armmgr -R full方式reset控制器以后发现,1号控制器VFP有报错,mismatch code等,而且根据VFP信息代码看出新控制器是HP14的版本,^_^|能看到错误是比较幸运的总比它闷声不吭的好。
7、自动同步不行干脆那咱就手工同步,armdownload -M M/C1同步等了240秒以后它有给了我一个沉重的打击,只报了一行failed。晕倒~既然如此不给面子那俺准备要下毒手了,执行阵列正常shutdown,armmgr -s shut,
用HP14版本的控制器启动阵列,然后手工用FW文件升级为HP19,虽然风险比较大,不过只要阵列正常shutdown,map信息就都在硬盘上,再说数据也已经备份过了,不用担心那么多。
8、说作就作,换的过程就不罗嗦了,单用这块的话控制器就顺利通过了自检,DIMM1灯亮起来了,而且可以用console连上,armdiscover 以后建议用cvui升级固件,很简单照着提示作就行了。
9、搞定这个控制器以后插上另一块HP19的控制器,^_^终于正常了。不过很快又郁闷了,阵列关了以后再开console提示NO MAP,Vfpdsp -f看结果Disk都是noinclude,faint~,不过理论是实践的基础,反正map在磁盘上有备份,直接vfprecover,等了几分钟,阵列自动重启,这下vfpdsp –f正常了。
10、不过系统还是不能用阵列的lun,重新ioscan也不行,干脆两台主机重启,重启后lun已经认出来了,然后激活vg,mount fs,启动oracle,一切正常。^_^|


需要注意的地方:1、如果需要更换cache,首先拆下控制器电池,放置2分钟以上再去更换控制器cache
                2、热插拔的时候注意不要碰到板子下面
           3、阵列控制器或填充板被移出不要超过5分钟。
           4、如果正常的给阵列断电,必须同时断开阵列后面两个电源插头
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表