服务器数据恢复环境:
10 个磁盘柜,每个磁盘柜 24 块硬盘;
9 个存储柜存储数据,1 个存储柜存储元数据;
元数据存储柜中的 24 块硬盘配置状况:9 组 RAID1 阵列 + 1 组 4 盘位 RAID10 阵列 + 4 个全局热备硬盘。
数据存储柜中硬盘配置:共 36 组 6 盘位的 RAID5,分为 2 个存储系统。
服务器故障:
数据存储柜的 1 个存储系统中的一组 RAID5 因为 2 块硬盘先后故障离线,RAID 阵列生效,整个存储系统解体,无奈应用。
存储及文件系统架构大抵如下:
注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)
服务器数据恢复过程:
1、为了避免服务器数据恢复操作对原始磁盘数据造成二次毁坏, 首先对存储中所有硬盘进行备份。
备份过程如下:
对故障 RAID 中的 6 块盘进行编号标记,将硬盘从存储柜中插入接入到备份服务器上进行备份。
对没有呈现故障的 RAID 阵列进行存储层面的备份。应用光纤线缆将备份平台和存储设备连贯,进入存储设备治理界面配置备份平台和存储设备让 2 者能够失常通信,应用软件对 RAID 中的 LUN 进行镜像备份。
在备份过程中发现故障 RAID 中的 1 块硬盘存在大量的坏道,在备份的过程呈现谬误,无奈持续备份。对故障硬盘收盘更换固件,应用工具对其进行修复后持续备份,但坏道依然存在。
局部镜像文件:
2、RAID 数据分析。
对故障 RAID 进行剖析获取相干 RAID 信息,应用软件对 RAID 阵列进行虚构重组,并将 RAID 中的 LUN 复原成镜像文件。在剖析过程中发现,损坏较重大的硬盘为后离线硬盘,因为此硬盘存在大量坏道,可能对最初的复原后果产生肯定的影响。
3、登录存储设备治理界面,获取到 StorNext 文件系统中卷的相干信息。
4、持续对 StorNext 文件系统中的 Meta 卷和 Data 卷进行剖析。本案例的 StorNext 文件系统蕴含 2 个 Data 卷,每一个残缺的 Data 卷都是由多组 RAID 中的 LUN 组成的。对这些 LUN 进行剖析获取到 LUN 之间组合的算法法则,虚构重组出残缺的 Data 卷。
5、剖析 Meta 卷。对 Meta 卷中的节点信息、目录项信息以及 Meta 卷和 Data 之间的对应关系进行剖析,针对一个 Meta 卷治理多个 Data 卷的状况钻研获取到 Meta 卷到 Data 卷的索引算法。
文件节点如下:
目录块如下:
6、扫描解析数据。
通过后面的剖析钻研曾经获取到了数据恢复工作所需的全副信息。北亚数据恢复工程师编写程序扫描 Meta 卷中的节点信息和目录项信息,同时对目录项和节点进行解析,获取残缺的文件系统目录构造,解析每一个节点中的指针信息,将这些信息记录在数据库中。
7、提取数据。
编写文件提取程序读取数据库,依据解析出的信息以及两个 Data 卷之间的聚合算法对数据进行提取。
8、数据检测验证。
对复原进去的数据进行随机抽样检测没有发现问题。将用户所需全副文件提取到本地进行数据移交。用户对复原进去的数据进行验证后确认复原进去的数据残缺无误。