关于数据恢复:服务器数据恢复IBM服务器硬盘不稳定导致宕机的数据恢复案例

服务器故障&检测：
某公司一台IBM某型号服务器共16块硬盘，管理员某天巡检的时候发现该服务器的10号和13号硬盘灯显示黄色，服务器宕机，服务器上跑的业务终止。
通过IBM storage manager查问服务器状态，逻辑卷状态报告“失败”；6号盘的物理硬盘状态报告“正告”，10号和13号盘报告“失败”。通过IBM storage manager将以后服务器的日志进行残缺备份，在备份的同时剖析日志内容，取得局部逻辑卷信息用于前期数据恢复应用。

服务器数据恢复过程：
1、将故障服务器内所有硬盘编号并取出。对所有硬盘进行物理故障检测，16块盘均能失常辨认。检测16块盘的SMART状态，后果发现6号盘的SMART状态为“正告”，和IBM storage manager中的报告统一。
2、将故障服务器中所有磁盘以只读形式进行扇区级别的镜像备份。在镜像过程中6号磁盘的镜像速度异样迟缓，联合6号盘SMART状态能够判断6号盘应该存在大量损坏的不稳固扇区，无奈通过惯例形式进行镜像。
3、应用业余设施对6号盘进行镜像，在镜像过程中发现6号盘的坏道并不多，只是存在大量不稳固扇区。调整镜像策略，批改“遇到坏道跳过扇区数”、“响应等待时间”等参数后持续对6号盘镜像。
4、所有磁盘镜像实现后查看日志，发现在IBM storage manager和硬盘SMART状态中均没有发现异常的1号盘也存在坏道，10号和13号盘也存在大量不法则的坏道散布。依据坏道列表定位到指标镜像文件，通过剖析发现ext3文件系统的一些要害源数据信息被毁坏。只能等所有硬盘镜像实现后，通过同一条带进行xor
以及依据文件系统上下文关系手动修复被损坏的文件系统。
5、尽管6号盘镜像实现，然而先前所做的镜像策略会主动跳过一些不稳固扇区，所以6号盘的镜像是不残缺的。从新调整拷贝策略持续镜像被跳过的扇区，实现6号盘所有扇区镜像。
6、实现所有硬盘的镜像后，北亚企安数据恢复工程师对ext3文件系统进行逆向剖析，联合对日志文件的剖析，最终获取到16块盘的盘序，RAID块大小，RAID的校验走向和形式等RAID相干信息。
7、利用获取到的RAID相干信息虚构重组RAID，重组实现后解析ext3文件系统，通过和用户沟通后提取出oracle的dmp文件并尝试进行复原。在应用dmp文件进行复原的过程中，oracle报告imp-0008谬误。北亚企安的oracle工程师剖析dmp文件的日志文件后发现提取出的dmp文件有问题。
8、从新剖析raid构造，进一步确定ext3文件系统被毁坏的水平。通过数据恢复工程师团队的不懈努力，终于从新提取出dmp文件和dbf原始库文件。将提取进去的dmp文件移交给用户，导入数据进行测试没有发现问题。对复原进去的dbf原始库文件进行校验，所有文件均通过测试。本次数据恢复工作实现。

关于数据恢复:服务器数据恢复IBM服务器硬盘不稳定导致宕机的数据恢复案例

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据恢复:服务器数据恢复IBM服务器硬盘不稳定导致宕机的数据恢复案例

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复