乐趣区

关于数据恢复:服务器数据恢复AIX下raid故障导致卷无法挂载的数据恢复案例

服务器数据恢复环境:
IBM P740 小型机 +AIX 操作系统 +Sybase 数据库 +V7000 存储。V7000 存储配置了 12 块 SAS 机械硬盘(其中一块为热备盘)组建一组 raid5 磁盘阵列。存储设备一共创立了 2 组 Mdisk,加到一个 pool 中。

服务器故障:
IBM V7000 存储中的磁盘产生故障,工作人员更换磁盘后并进行数据同步,同步没有实现时候存储中的另块磁盘呈现故障,导致逻辑盘无奈挂接在小型机上,业务中断。通过存储设备的治理界面看到有 2 块磁盘显示故障脱机,其中 10 号位的故障盘为热备盘,3 号位的故障硬盘状况如下图:

次要数据 pool 当初无奈加载,共三个通用卷均无奈挂载,如下图:

服务器数据恢复过程:
将故障存储中所有磁盘编号取出,将没有问题的 10 块磁盘以只读形式做全盘镜像,产生故障的 2 块磁盘应用业余工具解决后做镜像。后续所有的数据分析和数据恢复操作都基于镜像盘进行, 防止对原始磁盘数据造成影响。

计划 1、对存储进行强制上线操作。
a、剖析故障存储中故障硬盘的离线程序。
raid5 最大容许一块成员盘离线,该存储设备曾经生效,各组 Mdisk 中只有一块硬盘离线。提取故障存储的日志,通过剖析日志能够失去各故障硬盘的离线程序。

b、修复后离线的故障硬盘。
c、将修复的硬盘插回存储中进行强制上线操作。

计划 2、解析存储构造。
a、依据用户方给出的配置信息将硬盘依照 Mdisk 组分类。
b、通过剖析每一组 Mdisk 中的所有硬盘获取到 raid 相干信息。
c、虚构重组 Mdisk。
d、通过剖析重组进去的 Mdisk 获取到 pool 的相干信息。
e、解析 pool 在 Mdisk 上的散布状况,剖析 pool 中的条带大小。
f、解析 LUN 位图,剖析各 LUN 在 pool 中的散布状况。
g、北亚企安数据恢复工程师编写程序提取 LUN。

服务器数据验证:
随机抽样检测生成出的数据,没有发现问题。在用户方筹备好的存储设备上创立与原环境一样大小数量的 LUN,将提取进去的数据 LUN 的镜像文件复制到存储上创立的 LUN 中。数据移交后,用户方工程师重新配置存储环境,通过检测一切正常。本次数据恢复工作实现。

退出移动版