共计 1059 个字符,预计需要花费 3 分钟才能阅读完成。
服务器数据恢复环境:
华为 OceanStor 某型号存储,十几块 FC 硬盘组建一组 RAID5 磁盘阵列,装备了一块热备盘;下层应用 EXT3 文件系统,配置了 oracle 数据库。
服务器故障:
该存储 RAID5 中的一块硬盘未知起因离线,热备盘上线开始同步数据,同步未实现时候又有一块磁盘未知起因离线,数据同步失败,raid5 瘫痪,下层 lun 不可用。
服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出进行物理故障检测,检测后发现为先掉线的磁盘存在物理故障,其余磁盘包含后掉线的那块磁盘均无物理故障。
2、将所有磁盘以只读形式做全盘镜像,后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始磁盘数据造成二次影响。
3、基于镜像文件剖析 raid5 中的所有磁盘底层数据,找出热备盘。raid 是条带化的,阵列中的数据是依照肯定的法则进行存储的。数据恢复工程师剖析 raid 中的数据库页在每一个物理磁盘中的散布状况,计算出 raid5 的磁盘程序、数据走向、条带大小等 RAID 相干信息。
4、依据剖析进去的 RAID 相干信息,应用北亚企安自主开发的 RAID 重构程序将原始 RAID 虚构重构进去。但因为原始 RAID5 中掉线了 2 块盘且有 1 块盘的数据被同步毁坏,剖析每一块硬盘中的数据后发现有一块硬盘在同一个条带上的数据和其余硬盘显著不统一,初步判断此盘是被同步毁坏的硬盘。通过北亚企安自主开发的 RAID 校验程序校验这个条带,最终确定被同步损坏的磁盘。
5、剖析 lun 在 raid5 中的调配状态和 lun 调配的数据块,依据数据 MAP 导出 LUN 的数据。
6、因为应用了热备盘虚构重构 RAID,EXT3 文件系统无奈失常挂载。
7、提取 oracle 数据库文件,应用北亚企安自主开发的文件系统解析程序对其进行文件系统解析,而后导出 oracle 数据库文件。
8、将导出的数据库文件移交给数据库工程师进行校验和验证。应用 Oracle 数据库文件检测工具检测每个数据库文件的完整性。如果发现错误,应用北亚企安自主研发的 Oracle 数据库检测工具进行二次检测。检测后发现局部数据库文件和日志文件谬误,system 和 sysaux 表空间都存在坏块,管制文件全副损坏;eschoolspace 表空间的几个文件存在的坏块更多;undotbs02 失落;数据库数据恢复工程师对这些文件进行修复。
9、修复实现后,由用户方配合,启动 Oracle 数据库。在本地虚拟机装置 OA 客户端,通过 OA 客户端对数据记录进行验证。用户方安顿不同部门人员进行近程验证,通过重复验证,确认数据残缺无效。本次数据恢复工作实现。