服务器数据恢复环境:
10个磁盘柜,每个磁盘柜24块硬盘;
9个存储柜存储数据,1个存储柜存储元数据;
元数据存储柜中的24块硬盘配置状况:9组RAID1阵列+1组4盘位RAID10阵列+4个全局热备硬盘。
数据存储柜中硬盘配置:共36组6盘位的RAID5,分为2个存储系统。
服务器故障:
数据存储柜的1个存储系统中的一组RAID5因为2块硬盘先后故障离线,RAID阵列生效,整个存储系统解体,无奈应用。
存储及文件系统架构大抵如下:
注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)
服务器数据恢复过程:
1、为了避免服务器数据恢复操作对原始磁盘数据造成二次毁坏, 首先对存储中所有硬盘进行备份。
备份过程如下:
对故障RAID中的6块盘进行编号标记,将硬盘从存储柜中插入接入到备份服务器上进行备份。
对没有呈现故障的RAID阵列进行存储层面的备份。应用光纤线缆将备份平台和存储设备连贯,进入存储设备治理界面配置备份平台和存储设备让2者能够失常通信,应用软件对RAID中的LUN进行镜像备份。
在备份过程中发现故障RAID中的1块硬盘存在大量的坏道,在备份的过程呈现谬误,无奈持续备份。对故障硬盘收盘更换固件,应用工具对其进行修复后持续备份,但坏道依然存在。
局部镜像文件:
2、RAID数据分析。
对故障RAID进行剖析获取相干RAID信息,应用软件对RAID阵列进行虚构重组,并将RAID中的LUN复原成镜像文件。在剖析过程中发现,损坏较重大的硬盘为后离线硬盘,因为此硬盘存在大量坏道,可能对最初的复原后果产生肯定的影响。
3、登录存储设备治理界面,获取到StorNext文件系统中卷的相干信息。
4、持续对StorNext文件系统中的Meta卷和Data卷进行剖析。本案例的StorNext文件系统蕴含2个Data卷,每一个残缺的Data卷都是由多组RAID中的LUN组成的。对这些LUN进行剖析获取到LUN之间组合的算法法则,虚构重组出残缺的Data卷。
5、剖析Meta卷。对Meta卷中的节点信息、目录项信息以及Meta卷和Data之间的对应关系进行剖析,针对一个Meta卷治理多个Data卷的状况钻研获取到Meta卷到Data卷的索引算法。
文件节点如下:
目录块如下:
6、扫描解析数据。
通过后面的剖析钻研曾经获取到了数据恢复工作所需的全副信息。北亚数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,同时对目录项和节点进行解析,获取残缺的文件系统目录构造,解析每一个节点中的指针信息,将这些信息记录在数据库中。
7、提取数据。
编写文件提取程序读取数据库,依据解析出的信息以及两个Data卷之间的聚合算法对数据进行提取。
8、数据检测验证。
对复原进去的数据进行随机抽样检测没有发现问题。将用户所需全副文件提取到本地进行数据移交。用户对复原进去的数据进行验证后确认复原进去的数据残缺无误。