一、服务器数据恢复故障形容
服务器型号:EMCVNXe3100存储
硬盘数量:8块
Raid级别:raid5磁盘阵列
故障体现:2块硬盘离线,服务器解体,下层利用不可用
故障状况预判:典型的硬盘离线数量超过raid5的冗余数量导致的服务器数据失落,能够通过数据恢复操作对原始数据进行复原,预估数据恢复成功率为90%。
二、对服务器数据进行备份
数据恢复工程师首先将客户服务器内的所有硬盘通过镜像的形式进行备份,在备份过程中留神查看掉线硬盘是否存在物理故障,在本次数据恢复案例中,客户两块掉线硬盘均不存在物理故障,间接镜像即可。
三、服务器底层数据分析及数据恢复过程
镜像实现后,数据恢复工程师偿还了客户原始硬盘,开始在镜像文件上剖析底层数据,通过底层数据分析计算出服务器原始的硬盘盘序,raid条带大小、raid阵列信息等,通过数据恢复工具重组raid。
因为LUN是基于RAID组的,因而须要根据上述剖析的信息将RAID组重组进去。而后剖析LUN在RAID组中的调配信息,以及LUN调配的数据块MAP。因为底层只有一个LUN,因而只须要剖析一份LUN信息就OK了。而后依据这些信息应用raid恢复程序,解释LUN的数据MAP并导出LUN的所有数据。
四、解释ZFS文件系统并修复
数据恢复工程师对导出的lun进行了文件系统解释,在文件系统解释过程中呈现报错,数据恢复工程师对报错内容进行剖析,调试文件系统解释程序,通过剖析与调试确认是因为存储中某些元文件损坏导致解释zfs文件系统程序报错。数据恢复工程师针对这些损坏的文件进行了手动修复,以确保zfs文件系统能够被失常解析。
五、服务器数据恢复胜利
通过对zfs文件系统的修复和解析,验证最新数据,通过验证数据无误。分割客户管理员对复原的数据进行验证,确认数据恢复胜利,数据恢复率为100%。