服务器数据恢复环境:
华为OceanStor某型号存储,十几块FC硬盘组建一组RAID5磁盘阵列,装备了一块热备盘;下层应用EXT3文件系统,配置了oracle数据库。
服务器故障:
该存储RAID5中的一块硬盘未知起因离线,热备盘上线开始同步数据,同步未实现时候又有一块磁盘未知起因离线,数据同步失败,raid5瘫痪,下层lun不可用。
服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出进行物理故障检测,检测后发现为先掉线的磁盘存在物理故障,其余磁盘包含后掉线的那块磁盘均无物理故障。
2、将所有磁盘以只读形式做全盘镜像,后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始磁盘数据造成二次影响。
3、基于镜像文件剖析raid5中的所有磁盘底层数据,找出热备盘。raid是条带化的,阵列中的数据是依照肯定的法则进行存储的。数据恢复工程师剖析raid中的数据库页在每一个物理磁盘中的散布状况,计算出raid5的磁盘程序、数据走向、条带大小等RAID相干信息。
4、依据剖析进去的RAID相干信息,应用北亚企安自主开发的RAID重构程序将原始RAID虚构重构进去。但因为原始RAID5中掉线了2块盘且有1块盘的数据被同步毁坏,剖析每一块硬盘中的数据后发现有一块硬盘在同一个条带上的数据和其余硬盘显著不统一,初步判断此盘是被同步毁坏的硬盘。通过北亚企安自主开发的RAID校验程序校验这个条带,最终确定被同步损坏的磁盘。
5、剖析lun在raid5中的调配状态和lun调配的数据块,依据数据MAP导出LUN的数据。
6、因为应用了热备盘虚构重构RAID,EXT3文件系统无奈失常挂载。
7、提取oracle数据库文件,应用北亚企安自主开发的文件系统解析程序对其进行文件系统解析,而后导出oracle数据库文件。
8、将导出的数据库文件移交给数据库工程师进行校验和验证。应用Oracle数据库文件检测工具检测每个数据库文件的完整性。如果发现错误,应用北亚企安自主研发的Oracle数据库检测工具进行二次检测。检测后发现局部数据库文件和日志文件谬误,system和sysaux表空间都存在坏块,管制文件全副损坏;eschoolspace表空间的几个文件存在的坏块更多;undotbs02失落;数据库数据恢复工程师对这些文件进行修复。
9、修复实现后,由用户方配合,启动Oracle数据库。在本地虚拟机装置OA客户端,通过OA客户端对数据记录进行验证。用户方安顿不同部门人员进行近程验证,通过重复验证,确认数据残缺无效。本次数据恢复工作实现。