磁盘阵列管理的小技巧

[复制链接]
nas

该用户从未签到

22

主题

1

回帖

268

积分

[INTOHARD]排长

Rank: 3Rank: 3

积分
268
发表于 2006-12-25 19:56:44 | 显示全部楼层 |阅读模式
  磁盘阵列(Redundant Array of Inexpensive,简称RAID)作为数据存储的一种主要方式在许多企业中被大量采用。磁盘阵列是一种安全可靠的数据存储备份方式,但是磁盘阵列系统本身也存在着安全性的问题,也需要对其本身进行管理维护。若管理不到位,系统一旦出问题,很难用手工方式恢复,会给企业带来不必要的损失。因此根据不同的业务数据量、不同的数据安全性要求,并结合使用的磁盘阵列产品技术支持情况,制定适合的管理维护措施,可以避免系统出错,保证整个网络系统中数据的安全。

   注意检查运行日志文件

   磁盘阵列的日志文件详细记录了磁盘阵列内部运行情况,包括发生的每个事件序列号、严重级别、相关的服务器IP地址、有关设备的具体位置及事件发生的时间等内容,这些信息对于诊断和排除磁盘阵列故障十分有用。做好日志文件的日常管理工作,往往能起到防患与未然的作用。采用RAID数据冗余技术,即使有一个物理磁盘损坏,也不会影响系统正常运行和数据的I/O,用户也仍能够正常访问服务器,这时故障不易被察觉,但阵列实际上已处于安全临界状态,下一步就会面临着突然宕机和存储数据随时丢失的危险,日志文件及时将这一情况记录在册,损坏的磁盘记录为下线(off line),其所在阵列记录为临界状态(critical),通过检查日志就能够及时发现阵列运行中存在的这个错误和隐患,迅速排除故障,保证阵列始终处于安全运行状态。

   注意备份系统配置参数

   建立磁盘阵列系统后,要及时记录磁盘阵列的逻辑配置、物理配置、状态配置等参数,具体包括使用的每个逻辑盘大小、RAID类型、条带容量、数据写入磁盘方式、由哪些物理磁盘组成,每个物理磁盘的通道号、目标序列号、生产厂家、型号、容量、阵列控制器的型号、固件(Firmware)版本,处于后备待机状态(Hot Spare)还是在线状态(On Line)等。上述配置参数在磁盘阵列或操作系统崩溃后,在紧急重建阵列、恢复存储数据的过程中是必不可少的。一般阵列控制器BIOS芯片装载了阵列配置软件,管理员以文件形式备份上述参数。

   定时备份重要数据

   配备了磁盘阵列并不意味着可以高枕无忧了,由于考虑设备投入成本、技术复杂性等因素,不可能同时采用阵列控制器冗余、磁盘冗余、热备用磁盘、备用电池或双UPS电源供电等技术,所以,对于重要业务数据一定要备份。在美国“9·11”事件中,正是靠磁带备份和远程容灾系统挽救了金融界巨头摩根斯坦利公司,由此可见数据备份工作的重要性。数据备份的介质可以是磁带、可读写光盘,也可以还是磁盘。备份方式可以是通过操作系统本地备份或通过网络系统远程备份。

   建立热备用磁盘

   热备用磁盘也是RAID技术的又一项技术,当磁盘阵列中一个正在使用的物理磁盘发生故障后,一个待机的磁盘会立刻上线,代替此故障盘,阵列控制器根据逻辑驱动器上的冗余数据,通过校验算法把原来存储在故障盘上的数据重建到热备用磁盘上。成为热备用磁盘必须有三个条件:一是有不小于故障盘的容量;二是平时不得存储任何数据,也就是闲置不用;三是阵列控制器自动重建数据功能有效。在一个阵列中,只能有一个热备用磁盘。热备用磁盘增加了一次数据逃生的机会,系统管理员要及时更换发生故障的磁盘,并指定新的热备用磁盘。

   定期检查数据一致性

   数据冗余是磁盘阵列主要技术之一,磁盘阵列通过数据冗余达到容错目的,但是由于各种原因,难免会遇到冗余数据与主数据块(Primary Data)不一致的情况,结果造成数据失效甚至宕机等现象。一致性检查能及时发现和纠正潜在的错误数据,保证阵列中数据的完整性。通过对RAID互为镜像的磁盘数据一致性检查,或者主数据块进行重新校验,将产生的校验数据与冗余数据比较,都能发现不一致的错误数据。一致性检查一般间隔时间以每周1~2次为宜。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表