服务器数据恢复环境 & 故障:
10 个磁盘柜,每个磁盘柜配 24 块硬盘。9 个磁盘柜用于存储数据,1 个磁盘柜用于存储元数据。
元数据存储中 24 块硬盘,组建了 9 组 RAID1 阵列 + 1 组 RAID10 阵列,4 个全局热备硬盘。
数据存储中,组建了 36 组 6 硬 RAID5,36 组 RAID5 阵列划分为 2 个存储系统。其中 1 个存储系统中的一组 RAID5 中有 2 块硬盘先后呈现故障离线,RAID5 阵列不可用,存储系统解体。
存储及文件系统架构:
注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)
服务器数据恢复过程:
1、将故障 RAID5 中的 6 块盘编号标记后从磁盘柜中取出。通过硬件工程师检测,所有磁盘都能够失常读取。以只读形式对 6 块硬盘进行扇区级全盘镜像。对磁盘柜中没有呈现故障的 RAID 阵列进行存储层面的备份。
备份示意图:
在镜像过程中发现故障 RAID5 阵列中的 1 块故障离线硬盘存在大量的坏道区域,无奈持续备份。在用户方的受权下,将故障盘进行收盘更换固件并应用业余工具进行修复,修复实现后该硬盘能够持续备份,但坏道依然存在。
局部镜像文件:
2、基于镜像文件对故障 RAID5 阵列所有磁盘中的底层数据进行剖析,获取到重组 RAID 须要的相干信息,利用获取到的 RAID 信息虚构重组 RAID 阵列,并将该 RAID 阵列中的 LUN 复原成镜像文件。在剖析过程中发现,存在大量坏道的硬盘为后离线的硬盘。
3、登陆昆腾存储的治理界面,读取 StorNext 文件系统中与卷相干的信息。
4、剖析 StorNext 文件系统中的 Meta 卷和 Data 卷。每一个残缺的 Data 卷都是由多组 RAID 中的 LUN 组成的,通过剖析这些 LUN 获取到 LUN 之间组合的算法法则,虚构重组出残缺的 Data 卷。
5、剖析 Meta 卷,剖析 Meta 卷中的节点信息、目录项信息、Meta 卷和 Data 卷之间的对应关系。针对一个 Meta 卷治理多个 Data 卷的状况,钻研 Meta 卷到 Data 卷的索引算法。
文件节点:
目录块:
6、通过剖析钻研获取到了复原数据所须要的全副信息,北亚企安数据恢复工程师编写程序扫描 Meta 卷中的节点信息和目录项信息,同时通过对目录项和节点解析获取到残缺的文件系统目录构造。解析每一个节点中的指针信息,将这些信息记录在数据库中。
文件信息:
7、北亚企安数据恢复工程师编写文件提取程序读取数据库,依据解析进去的信息以及两个 Data 卷之间的聚合算法提取数据。
8、对提取进去的数据进行随机抽样检测,没有发现问题。将全副文件提取到本地,由用户方进行检测。通过认真检测后,用户方认可数据恢复后果。本次数据恢复工作实现。