关于数据恢复:服务器数据恢复EMC存储raid5热备盘启用失败的数据恢复案例

38次阅读

共计 850 个字符,预计需要花费 3 分钟才能阅读完成。

服务器数据恢复环境:
某公司一台 EMC 某型号存储中有一组由 12 块硬盘组建的 raid5 磁盘阵列,其中有 2 块盘作为热备盘应用。

服务器故障 & 剖析:
raid5 磁盘阵列中有 2 块磁盘离线,只有 1 块热备盘胜利启用,另外一块热备盘未启用,raid 阵列解体。
服务器硬盘离线的起因无非为磁盘呈现物理故障或者硬盘呈现坏道。因为 EMC 的 raid 控制器磁盘查看策略比拟严格,常常将阵列中性能不稳固的磁盘断定为物理故障并踢出阵列。所以导致 EMC 存储中磁盘阵列解体的起因有可能是因为磁盘读写不稳固。

服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出,由硬件工程师对所有磁盘做物理故障检测,通过检测发现没有磁盘存在物理故障和坏道。以只读形式将所有磁盘做全盘镜像备份,备份实现后将所有磁盘依照编号还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始磁盘数据造成二次毁坏。

2、基于镜像文件剖析原 RAID5 磁盘阵列构造,通过剖析发现 2 块热备盘上没有数据,其中一块热备盘已胜利激活并替换了其中的一块离线磁盘,但数据并未同步。持续剖析条带大小、数据的散布法则、磁盘程序等 raid 相干信息,发现有一块盘在同一条带上的数据与 raid 中其余硬盘不同,初步判断该盘为掉线较早的硬盘。应用北亚企安自主开发的 raid 校验程序对此条带进行校验,确认这块盘为先掉线的盘。通过剖析获取到的 raid 相干信息虚构重构原 raid5 磁盘阵列。

3、对磁盘阵列中的 LUN 信息进行剖析后解释 map 数据并导出。应用北亚企安自主开发程序解释 zfs 文件系统,某些文件系统中的文件在解析过程中报错。北亚企安数据恢复工程师手动 debug 程序做后发现报错的起因是 ZFS 文件系统在进行 I / O 操作时 raid 阵列解体导致某些元文件损坏,程序无奈失常解释。只有修复好损坏的文件系统元文件后,能力应用程序解析 ZFS 文件系统。

4、应用程序解析修复好的 ZFS 文件系统,解析所有文件节点及目录构造。通过用户方工程师的重复验证,确认复原进去的数据残缺可用。
局部文件目录和验证截图:

正文完
 0