关于数据恢复:服务器数据恢复意外断电导致RAID模块信息丢失的数据恢复案例

121次阅读

共计 984 个字符,预计需要花费 3 分钟才能阅读完成。

服务器数据恢复环境:
HP ProLiant 系列服务器;
6 块 73GB 的 SAS 硬盘组成的 RAID5;
操作系统:WINDOWS SERVER;
存储文件:企业的外部文件,无数据库文件。

服务器故障:
因为没有装备 UPS,服务器遇到几次意外断电,然而重启后没有出现异常,直到最近一次断电重启后 RAID 报错,无奈找到存储设备,进入到 RAID 治理模块进行操作导致死机。服务器管理员屡次尝试重启服务器,然而没法进入零碎。

服务器故障剖析:
本案例是典型的服务器意外断电导致的 RAID 模块损坏(包含 RAID 治理信息失落和 RAID 模块硬件损坏)。个别在 RAID 阵列创立实现后,阵列的治理模块信息就会固定下来不再产生扭转,然而阵列的模块信息是能够批改的。服务器意外断电很容易造成阵列的模块信息被篡改甚至失落,屡次断电甚至有可能造成 RAID 卡上的元器件损坏,使主机失去对多块物理硬盘进行 RAID 治理的中间层模块。该案例中对 RAID 模块的操作导致死机极有可能是因为 RAID 卡硬件损坏,应用惯例办法无奈获取 6 块硬盘中的数据,只能通过业余的数据恢复操作来复原原先的数据。

服务器数据恢复过程:
1、首先对原服务器内所有硬盘进行物理故障检测,查看硬盘是否有硬件故障。检测后发现服务器内所有硬盘均能够失常读取,没有发现存在物理故障。
2、对服务器内的所有硬盘进行镜像备份。
3、镜像实现后,服务器数据恢复工程师剖析 raid 构造,确定 raid 阵列的硬盘程序、数据块的大小和阵列校验形式等 raid 信息。
4、服务器数据恢复工程师利用剖析获取到的 raid 阵列信息虚构重建一组 RAID 并进行逻辑校验,确认重构的 RAID 所利用的各项参数正确无误后,针对服务器管理员最为关注的数据进行验证;
5、数据恢复工程师分割服务器管理员对复原进去的数据进行验证,通过验证后所有数据均胜利复原;
6、把数据迁徙到服务器管理员从新搭建进去的和原服务器一样的环境中,通过测试后一切正常。

服务器数据安全小贴士:
1、保障机房供电稳固,尽量减少供电异样对主机及存储的影响;
2、为要害的服务器和存储配置 UPS,在机房意外断电的状况下保障外围业务零碎能持续维持失常工作,为其余应急计划的施行争取时间;
3、对于应用工夫长的服务器应定期进行安全检查,对其整体运行状态进行评估,是否对其进行硬件及零碎的降级;
4、提前制订突发数据劫难的应急解决计划,缩小数据劫难带来的损失。

正文完
 0