关于数据恢复:北亚数据恢复EMC存储服务器riad5硬盘故障掉线导致服务器崩溃的数据恢复案例

45次阅读

共计 937 个字符,预计需要花费 3 分钟才能阅读完成。

环境:
EMC 存储服务器;
10 块硬盘组成 RAID5 磁盘阵列。

故障:
RAID5 磁盘阵列有 3 个硬盘因为故障离线导致服务器瘫痪。管理员增加了新硬盘做 rebuild,然而没有拔掉掉线的硬盘,服务器中有 3 块多余硬盘。

数据恢复过程:
1、服务器管理员初步判断服务器瘫痪是因为阵列中硬盘呈现硬件故障导致的,于是将所有硬盘交给北亚数据恢复核心进行了物理检测。北亚硬件工程师对服务器中所有硬盘进行检测后没有发现硬盘存在物理故障,把硬盘移交给北亚数据恢复工程师进行解决。

2、对所有磁盘进行镜像备份后,北亚数据恢复工程师开始对服务器 raid 构造进行剖析。

3、北亚数据恢复工程师发现该服务器中的硬盘每 512 字节就多减少了一个 8 字节的校验,也就是每扇区 520 字节。这种状况下持续进行 raid 构造剖析将十分困难。北亚数据恢复工程师编写了一个小程序将 8 字节的校验去掉,不便前期的工作。

4、用这个小程序将所有磁盘都转换实现后,北亚数据恢复工程师持续剖析 RAID 的构造。因为多了 3 块旧盘,须要通过比拟每块磁盘,即其中会有两块磁盘后面的一部分雷同,而这两块磁盘中会有一个是旧的,因为旧的数据量没有新盘多,所以数据量少的就是旧盘,依照这种思路能够分辨出新盘和旧盘。这样的磁盘会有 3 对。

5、此服务器应用的是 NTFS 文件系统,能够用 MFT 弄清楚 RAID 构造。搞清楚 RAID 构造后,北亚数据恢复工程师发现这是一个双循环 RAID 5。因而无奈借助数据恢复工具重组 RAID,北亚数据恢复工程师只好通过其余形式重组 raid 阵列。

6、重组 RAID 后发现数据不是最新的。北亚数据恢复工程师推断呈现这种问题的起因是:RAID5 第一块硬盘掉线的时候管理员没有及时发现,没有及时增加新的硬盘做 rebuild,导致服务器运行一段时间后又有一块硬盘掉线了,才造成整个 RAID 不可用。所以还须要找出一块旧的磁盘,能力生成最新的数据。

7、北亚数据恢复工程师采纳穷举加校验的办法进行剖析,即假如某个磁盘是掉线的,踢掉磁盘后重组 RAID,但不是生成全副的数据,而是只生成后面 5G 的数据,咱们只须要查看这个索引表的位图的信息是否正确就能够判断此 RAID 是否正确。如果正确,那么生成此 RAID 的数据即可实现 RAID 的重组。通过 3 天的致力,数据最终完全恢复。

正文完
 0