关于数据恢复:服务器数据恢复服务器断电导致RAID5卡硬件故障的数据恢复

42次阅读

共计 930 个字符,预计需要花费 3 分钟才能阅读完成。

服务器数据恢复环境:
某品牌 ProLiant DL 系列服务器,
6 块 SAS 硬盘组成 RAID5 磁盘阵列,
WINDOWS SERVER 操作系统,
存储了企业的外部文件。

服务器故障 & 剖析:
服务器在产生故障前有过几次意外断电,每次断电重启后没有出现异常。直到最初一次断电重启没有胜利,RAID 报错,提醒无奈找到存储设备。进入 RAID 治理模块,执行任何操作就死机。管理员屡次重启服务器后还是无奈胜利进入操作系统。
通常服务器呈现这类故障,有很大的可能性是因为意外断电导致 RAID 模块损坏(RAID 治理信息失落或 RAID 模块硬件损坏)。RAID 阵列创立实现后,治理模块信息就会固定下来不会再发生变化。然而 raid 阵列的模块信息毕竟不是只读的,也是能够批改的,而意外断电就可能导致模块信息被篡改或者失落,屡次断电甚至可能导致 RAID 卡元器件损坏,服务器失去对多块物理硬盘进行 RAID 治理的中间层模块。依据本案例服务器的故障体现,北亚企安数据恢复工程师初步判断故障起因就是 RAID 卡硬件损坏,如果是这种状况,通过惯例办法无奈获取 6 块磁盘中的数据。

服务器数据恢复过程:
1、通过物理故障检测发现故障服务器内的所有硬盘均能够失常读取,无物理故障。
2、编号后将故障服务器内的所有硬盘以只读形式进行镜像备份,镜像实现后将所有硬盘依照编号还原到故障服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始数据造成二次毁坏。
3、基于镜像文件,北亚企安数据恢复工程师剖析故障服务器中 raid5 磁盘阵列构造,确定 raid 阵列的硬盘程序、数据块大小、阵列校验形式等 raid 相干信息。
4、利用获取到的 raid 阵列信息虚构重构 raid 阵列并进行逻辑校验,确保重构 RAID 各项参数正确无误后验证重要数据。
5、通过数据恢复工程师验证后没有发现异常,让管理员亲自验证无问题后将数据迁徙到提前准备好的环境中,本次数据恢复工作实现。

服务器数据安全 Tips:
1、尽量保障机房供电稳固,重要设施装备 UPS,以缩小供电异样影响服务器及存储的失常工作。
2、应定期对老旧设施进行安全检查,评估老旧设施的运行状态,评估是否须要对老旧设施进行硬件降级或者系统升级。
3、提前制订突发事件应急解决计划,以升高异样断电带来的损失。

正文完
 0