关于数据恢复:服务器数据恢复ZFS文件系统下ZPOOL下线的数据恢复案例

服务器数据恢复环境：
SUN ZFS系列某型号存储阵列；
40块磁盘组建的存储池（其中4块磁盘用作全局热备盘），池内划分出若干空间映射到服务器应用；
服务器应用Windows操作系统。

服务器故障：
服务器在工作时因为未知起因解体，排除断电、进水或者误操作等内部因素。管理员重启服务器后发现无奈进入零碎，须要复原该存储内的所有数据。

服务器数据恢复过程：
1、对故障存储中所有硬盘以只读形式做镜像备份，后续的数据分析和数据恢复操作都基于镜像文件进行，防止对原始数据造成二次毁坏。
2、剖析磁盘镜像，发现故障设施是通过ZFS文件系统来治理所有磁盘。磁盘内记录零碎元信息的NVLIST较为凌乱，只能粗略得悉以下信息：故障存储中的磁盘被分为三组，每组12块；每个组应用ZFS文件系统独有的RAIDZ治理磁盘。RAIDZ级别为2，即每个组最多可缺失2块磁盘；故障存储内的4块全局热备全副启用。
Tips：ZFS文件系统中的池被称为ZPOOL。ZPOOL的子设施能够有很多类型：块设施、文件、磁盘等等。本案例中所采纳三组RAIDZ作为子设施。
3、通过进一步剖析，发现三组RAIDZ内有两组别离启用的热备盘个数为1和3。在热备盘启用后，第一组内又呈现一块离线盘，第二组内则又呈现两块离线盘。通过下面剖析失去的论断能够模仿故障现场：三组RAIDZ中的第一组和第二组别离呈现离线盘，热备盘及时进行替换；在热备盘无冗余的状态下第一组RAIDZ又呈现一块离线盘，第二组RAIDZ则又呈现两块离线盘，ZPOOL进入高负荷状态（每次读取数据都须要通过校验能力失去正确数据）。当第二组RAIDZ呈现了第三块离线盘时候，RAIDZ解体、ZPOOL下线、服务器解体。
4、因为ZFS文件系统治理的存储池与惯例存储不同。惯例RAID在存储数据时只会依照特定的规定组建池，不关怀文件在子设施上的地位。而ZFS文件系统在存储数据时会为每次写入的数据调配适当大小的空间，并计算出指向子设施的数据指针。ZFS文件系统的这种个性决定了RAIDZ缺盘时无奈间接通过校验失去数据，必须将整个ZPOOL作为一个整体进行解析。于是，北亚企安数据恢复工程师手工截取事务块数据，并编写程序获取最大事务号入口。
获取文件系统入口：

获取到文件系统入口后，北亚企安数据恢复工程师编写数据指针解析程序进行地址解析。
解析数据指针：

获取到文件系统入口点在各磁盘的散布状况后，数据恢复工程师开始手工截取并剖析文件系统内部结构。因为入口散布所在的磁盘组无缺失盘，可间接提取信息。依据ZFS文件系统的数据存储构造找到用户映射的LUN名称，进而找到其节点。
5、通过剖析发现故障存储中的ZFS文件系统版本与开源版本有很大差异，无奈应用之前开发的解析程序进行解析，所以北亚企安数据恢复工程师从新编写了数据提取程序提取数据。

6、因为磁盘组内缺盘个数较多，每个IO流都须要通过校验失去，所以提取进度极为迟缓。与用户沟通后得悉，此ZVOL卷映射到XenServer作为存储设备，用户所需的文件在其中一个大小约为2T的vhd内。提取ZVOL卷头部信息，依照XenStore卷存储构造进行剖析，发现这个2T的vhd在整个卷的尾部，计算其起始地位后从此地位开始提取数据。
7、Vhd提取结束后，验证其外部的压缩包、图片和视频等文件，均可失常关上。分割用户亲自验证数据，通过重复验证后确定文件数量与零碎自动记录的文件数量相差无几，缺失的那局部极少数量的文件可能因为是最新生成还未刷新到磁盘。验证文件可用性，文件全副可失常关上，本次数据恢复工作实现。

关于数据恢复:服务器数据恢复ZFS文件系统下ZPOOL下线的数据恢复案例

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据恢复:服务器数据恢复ZFS文件系统下ZPOOL下线的数据恢复案例

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复