共计 873 个字符,预计需要花费 3 分钟才能阅读完成。
服务器数据恢复环境:
HP EVA 存储,6 块 SAS 硬盘组建的 raid5 磁盘阵列。下层操作系统是 WINDOWS SERVER。该存储为公司外部文件服务器应用。
服务器故障 & 剖析:
在遭逢两次意外断电后,设施重启时 raid 提醒“无奈找到存储设备”。管理员尝试进入 raid 治理模块时死机,屡次重启尝试后故障仍旧。
这是一个典型的因为意外断电导致 raid 硬件模块损坏或者 riad 治理信息失落等 raid 故障的状况。失常状况下,raid 一旦创立实现,raid 治理模块中的信息不会轻易更改,然而 raid 治理模块的信息是可批改的信息。一次或屡次的意外断电是有可能导致 raid 治理模块中的信息被篡改或失落,断电次数过多时甚至可能间接导致 raid 卡上的元器件损坏。该案例中的故障就是属于这种状况。
服务器数据恢复过程:
1、首先由硬件工程师检测故障存储中的所有硬盘的物理故障,所有硬盘读取失常,没有发现存在显著的物理故障。
2、将故障存储中所有磁盘以只读形式进行全盘镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,防止对原始磁盘数据造成二次毁坏。
3、北亚企安数据恢复工程师基于镜像文件剖析底层数据,确定故障存储中 6 块磁盘的数据块大小、条带信息、盘序、校验形式等 RAID 信息,依据这些信息虚构重建 raid 阵列。
4、逻辑校验重构 RAID 中的数据,在确认重构 RAID 各参数正确无误后,对所须要复原的数据进行齐全验证。
5、在数据恢复工程师验证没有发现问题后,交由用户方亲自验证。通过重复验证,用户方工程师确认复原的数据残缺可用,达到预期。
6、将数据迁徙至用户方筹备好的存储环境中,再次验证没有发现问题。
服务器数据安全 Tips:
1、尽量保障机房供电稳固,缩小供电异样对服务器和存储的影响。
2、为重要的服务器及存储装备 UPS,在意外断电的状况下能让外围业务持续运行一段时间,为应急计划的施行博得工夫。
3、定期对服务工夫长的服务器和存储进行平安情况查看,对这些老旧设施的整体运行状态进行评估,及时更换硬件和降级软件,将可能的隐患提前排除。
4、制订突发数据劫难的紧急解决计划,升高业务损失。