|
RAID5现场恢复过程小记
在开始之前我把RAID卡界面的英语和汉语对照写一下
HOST 热备盘
FORCE OLNINE 强制上线
FAIL 失效
ONLIN 在线
OFFINE 离线
READ 空闲,可用的
Initialize 初使化
近日接到一个在联想朋友的电话,说一部队客户的5块盘的RAID5两块盘离线.无法起动.有重要数据,必须要现场操作.了解情况后得之,该阵列5块盘的RAID5没做HOST盘.其中一块盘离线多日.客户没在意.最近服务器总死机.客户认为是先离线硬盘导致的,准备拔出来测试.但该服务器没有坏盘的故障灯.客户在操作故障盘时拿错,再插回去,RAID卡不认,且没有FORCE ONLINE这一功能.导致RAID崩溃.和客户沟通后情况确认属实,确定其中第一块掉线盘应是物理故障.第二天带了块新盘到达现场.进RAID卡界面查看发现,一块盘状态是fail,一块盘状态是READ 三块盘是ONLIN, RAID 状态是offine .盘序没变,记下了RAID和块大小。以我们对这块RAID卡的了解,向客提出了两个恢复方案,
第一通过RAID卡进行强制恢复(速度快,失败后不影响第二个方案的进行),
第二手工重组.(1.2T的数据.需要1天的COPY)
客户同意第一种方案,通过RAID界面控制我们找到了FAIL盘,并替换成了新盘.因为该卡无FORCE ONLINE选项.开始实施
第一步 清除原阵列信息(卡和硬盘同时清除)
第二步 通过配置界面按原来的盘序,大小和块大小,重新配置RAID5(千万不要 initialize)
第三步 保存重启,再次进入配置界面把新加入的盘标记fail
第四步 保存重启正常进入了系统.数据恢复完成
第五步 对新盘进行rebuild. RAID状态正常,全部恢复工作完成
小记,只可观看不可模仿(对RAID卡一定要有相当的了解,才能这样操作)后果自负
对恢复过程有疑问的朋友可以加QQ讨论一下
QQ 63678313 12:00:00 |
-
本帖评分记录 | 威望 |
金子 |
贡献 |
收起
理由
|
dgtan
| + 10 |
+ 30 |
+ 10 |
支持原創 |
总评分: 威望 + 10
金子 + 30
贡献 + 10
|