关于数据恢复:北亚服务器数据恢复IBM-DS系列存储硬盘故障导致RAID5崩溃的数据恢复

97次阅读

共计 769 个字符,预计需要花费 2 分钟才能阅读完成。

服务器数据恢复环境:
IBM DS 系列存储,一个机头,连贯 4 个扩大柜;
50 块 600GB 硬盘组建的 2 组 RAID;
其中一组是由 27 块 600G 硬盘组成的 RAID5,存放数据是 Oracle 数据库文件,在存储系统下层一共分了 11 个卷(10 个 1TB,1 个 4TB)。

故障:
那组由 27 块 600G 硬盘组成的 RAID5 因为磁盘故障而解体,这组 raid5 寄存的数据是 Oracle 数据库文件。服务器管理员分割北亚数据恢复核心进行数据恢复。

服务器数据恢复过程:
1、北亚硬件工程师对 27 块硬盘做了硬件检测,发现 2 块硬盘呈现坏道,SMART 的谬误冗余级别超过阀值。服务器数据恢复工程师对 25 块完整的磁盘做全盘镜像,对 2 块故障磁盘进行硬件修复并做镜像备份。

2、故障剖析:对这台 IBM 存储上收集到的日志信息进行剖析,搞清楚 2 块故障硬盘的掉线先后顺序,从而找到数据最新的那块硬盘,用这块硬盘进行接下来的数据恢复。
 
3、通过钻研,北亚数据恢复工程师确定了套解决方案:
计划一:通过 IBM DS 存储管理软件进行强制上线,在强制上线之前把存储的所有硬盘都进行备份,之后进行强制上线。
计划二:通过对硬盘底层数据分析,进行 RAID 重组,从底层提取数据,从新加载 oracle 数据库,调试下层利用。

4、施行第一种解决方案,先在模拟器上进行测试,之后在存储上进行上线操作。
通过 IBM DS 存储管理软件进行强制上线,强制上线之后 raid 处于降级状态,这个时候设置好热备盘,让热备盘上线进行数据同步,同步完之后下层的卷间接能够用了,所有数据也都可见了,下层利用也能失常应用。
第一种解决方案节俭了很多工夫,下层利用也不须要在调试,能够间接启动。

数据恢复后果:
因为下层的卷间接可用,数据也都可见了,通过用户亲自验证,数据残缺可用。出于平安思考,还是将卷里的文件都拷贝进去移交给用户。整个复原过程一共历时 5 天。

正文完
 0