关于数据恢复:服务器数据恢复raid5崩溃导致lvm信息和VXFS文件系统损坏的数据恢复案例

服务器数据恢复环境：
8块SAS硬盘中的7块硬盘组成RAID5阵列，1块作为热备盘。

服务器故障：
故障服务器存储中的RAID5阵列有2块硬盘损坏离线，RAID5阵列瘫痪，影响下层LUN无奈失常应用。管理员分割咱们数据恢复核心进行数据恢复，硬件工程师检测硬盘没有发现物理故障和坏道。

服务器数据恢复过程：
1、备份数据。应用数据恢复工具将所有磁盘镜像备份。

2、剖析RAID构造。
故障服务器的LUN都是基于RAID的，须要先剖析底层RAID的信息，再根据剖析获取到的raid相干信息重构原始RAID。通过剖析获知4号盘为hot Spare盘。剖析Oracle数据库页在每个磁盘中的散布状况得出RAID组的条带大小，磁盘程序及数据走向等RAID组的重
要信息。

3、剖析RAID掉线盘。
利用剖析获取到的RAID信息，通过北亚自主开发的RAID虚构程序将原始的RAID拟进去。仔细分析每一块硬盘中的数据，通过北亚自主开发的RAID校验程序对条带做校验，将最先掉线的硬盘剔除出raid。

4、剖析RAID组中的LUN信息。
将RAID最新的状态虚构进去当前剖析LUN在RAID中的分配情况和LUN调配的数据块MAP。只须要将底层6个LUN的数据块散布MAP提取进去，而后针对这些信息编写相应的程序对所有LUN的数据MAP做解析，依据数据MAP导出所有LUN的数据。

5、解析LVM逻辑卷。
剖析生成进去的所有LUN，发现所有LUN中均蕴含HP-Unix的LVM逻辑卷信息。尝试解析每个LUN中的LVM信息，发现一共有三套LVM：其中一套LVM中划分了一个LV，寄存OA服务器端的数据，另外一套LVM中划分了一个LV，寄存长期备份数据
。其余4个LUN组成一套LVM并划分了一个LV，寄存Oracle数据库文件。北亚数据恢复工程师编写解释LVM的程序尝试将每套LVM中的LV卷解释进去，但解释程序出错。

6、修复LVM逻辑卷。
仔细分析报错的起因，由开发工程师debug程序出错的地位并由高级文件系统工程师检测复原进去的LUN，检测存储瘫痪是否导致LMV逻辑卷的信息损坏。通过认真检测，发现存储瘫痪的确导致了LVM信息损坏。尝试人工对损坏的区域进行修复，并批改LVM解释程序从新解析LVM逻辑卷。

7、解析VXFS文件系统。
搭建HP-Unix环境并将解释进去的LV卷映射到HP-Unix，尝试Mount文件系统。后果Mount文件系统出错，尝试应用“fsck –F vxfs” 命令修复vxfs文件系统，修复实现后还是不能挂载，狐疑底层vxfs文件系统的局部元数据被毁坏，须要进行手工修复。

8、修复VXFS文件系统。
仔细分析解析进去的LV，并依据VXFS文件系统的底层构造校验此文件系统是否残缺。通过剖析发现底层VXFS文件系统有问题，起因是存储瘫痪的时候文件系统正在执行IO操作，因而局部文件系统元文件没有更新导致损坏。对这些损坏的元文件进行手工修复让VXFS文件系统可能失常解析。再次将修复好的LV卷挂载到HP-Unix小机上，尝试Mount文件系统没有报错，胜利挂载。

9、复原所有用户文件。
在HP-Unix机器上mount文件系统后将所有用户数据均备份至指定磁盘空间。局部文件目录截图如下：

10、检测数据库文件是否残缺。
应用Oracle数据库文件检测工具“dbv”检测每个数据库文件是否残缺，没有发现错误。应用北亚自主研发的Oracle数据库检测工具检测发现有局部数据库文件和日志文件校验不统一，数据库工程师对此类文件进行修复并再次校验，直到所有文件校验齐全通过。

11、启动Oracle数据库。
因为咱们数据恢复核心提供的HP-Unix环境没有此版本的Oracle数据库，和用户协调将原始环境带至北亚数据恢复核心，而后将复原进去的Oracle数据库附加到原始生产环境的HP-Unix服务器中并尝试启动Oracle数据库，启动胜利。局部截图如下：

12、数据验证。
由用户方配合启动Oracle数据库，启动OA服务端，在本地电脑端装置OA客户端。通过OA客户端对最新的数据记录以及历史数据记录进行验证，并且安顿不同部门人员进行近程验证。最终数据验证无误，数据残缺，数据恢复胜利。

数据恢复论断：
因为故障产生后保留现场环境良好，没有做相干危险的操作，对前期的数据恢复有很大的帮忙。整个数据恢复过程中尽管遇到好多技术瓶颈，但也都一一解决。最终在预期的工夫内实现整个数据恢复，复原的数据用户方也相当称心，Oracle数据库服务，OA服务端等所有服务可能失常启动。