服务器数据恢复环境:
一台服务器中有一组由数块 SAS 硬盘组建的 RAID5 阵列,阵列中有 1 块热备盘,下层部署 OA 以及 Oracle 数据库。
服务器故障:
该磁盘阵列中有 2 块硬盘呈现故障先后离线,RAID5 阵列瘫痪,下层 LUN 无奈失常应用。通过检测发现硬盘无物理故障,无坏道。
服务器数据恢复过程:
1、将故障服务器中所有磁盘编号后取出,以只读形式做全盘镜像,备份实现后将磁盘依照编号还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始磁盘数据造成二次毁坏。
2、基于镜像文件剖析底层数据获取 RAID 条带大小、磁盘程序及数据走向等 RAID 相干信息,依据获取到 RAID 信息重组 RAID5。
3、剖析 LUN 在 RAID 中的分配情况和 LUN 调配的数据块 MAP。提取每一个 LUN 的数据块散布 MAP,北亚企安数据恢复工程师编写程序解析所有 LUN 的数据 MAP,依据数据 MAP 导出所有 LUN 的数据。
4、对导出的 LUN 的数据进行剖析,发现所有 LUN 中均蕴含 HP-Unix 的 LVM 信息。通过解析每个 LUN 中的 LVM 信息,发现共有三套 LVM:一个 LVM 划分了一个 LV 来寄存 OA 服务器端的数据;第二个 LVM 中也划分了一个 LV 来寄存长期备份数据;剩下的 4 个 LUN 组建了一个 LVM,划分了一个 LV 来寄存 Oracle 数据库文件。
5、北亚企安数据恢复工程师编写程序解释每套 LVM 中的 LV 卷,但在解释的过程中程序报错。通过剖析发现报错起因是 raid5 瘫痪导致 LVM 信息损坏。人工修复损坏区域后,同步批改解释程序后胜利解释 LVM 逻辑卷。
6、搭建 HP-Unix 环境,将解释进去的 LV 卷映射到 HP-Unix 并尝试挂载文件系统。然而挂载文件系统时出错,尝试应用“fsck –F vxfs”命令修复 vxfs 文件系统,但修复实现后还是无奈挂载。
7、剖析解释进去的 LV,依据 VXFS 文件系统的底层构造校验此文件系统的完整性。通过剖析发现 VXFS 文件系统果然有问题,呈现问题的起因是:当 raid5 瘫痪时 VXFS 文件系统正在执行 IO 操作,导致局部文件系统元文件没有更新以及损坏。手工修复这些损坏的元文件直至可能失常解析 VXFS 文件系统。
8、将修复好的 LV 卷挂载到 HP-Unix 小机上,尝试 Mount 文件系统,这次没有报错,胜利挂载。
9、在 HP-Unix 小机上胜利 mount 文件系统后,将所有用户数据均备份至指定的磁盘空间。局部文件目录截图如下:
10、应用 Oracle 数据库文件检测工具检测数据库文件的完整性,检测无误后应用北亚企安自主研发的 Oracle 数据库检测工具进行检测,通过检测发现局部数据库文件和日志文件校验不统一。数据库工程师对这部分文件进行修复后并再次校验,直至所有数据库文件均通过校验。
11、将复原进去的 Oracle 数据库附加到原始生产环境中,尝试启动 Oracle 数据库,启动胜利。
数据验证:
在用户方的配合下启动 Oracle 数据库和 OA 服务端。在本地电脑上装置 OA 客户端,通过 OA 客户端验证新旧数据记录,安顿不同部门人员进行近程验证。通过重复验证确认数据残缺无误。本次数据恢复工作实现。