服务器故障&检测:
某公司一台IBM某型号服务器共16块硬盘,管理员某天巡检的时候发现该服务器的10号和13号硬盘灯显示黄色,服务器宕机,服务器上跑的业务终止。
通过IBM storage manager查问服务器状态,逻辑卷状态报告“失败”;6号盘的物理硬盘状态报告“正告”,10号和13号盘报告“失败”。通过IBM storage manager将以后服务器的日志进行残缺备份,在备份的同时剖析日志内容,取得局部逻辑卷信息用于前期数据恢复应用。
服务器数据恢复过程:
1、将故障服务器内所有硬盘编号并取出。对所有硬盘进行物理故障检测,16块盘均能失常辨认。检测16块盘的SMART状态,后果发现6号盘的SMART状态为“正告”,和IBM storage manager中的报告统一。
2、将故障服务器中所有磁盘以只读形式进行扇区级别的镜像备份。在镜像过程中6号磁盘的镜像速度异样迟缓,联合6号盘SMART状态能够判断6号盘应该存在大量损坏的不稳固扇区,无奈通过惯例形式进行镜像。
3、应用业余设施对6号盘进行镜像,在镜像过程中发现6号盘的坏道并不多,只是存在大量不稳固扇区。调整镜像策略,批改“遇到坏道跳过扇区数”、“响应等待时间”等参数后持续对6号盘镜像。
4、所有磁盘镜像实现后查看日志,发现在IBM storage manager和硬盘SMART状态中均没有发现异常的1号盘也存在坏道,10号和13号盘也存在大量不法则的坏道散布。依据坏道列表定位到指标镜像文件,通过剖析发现ext3文件系统的一些要害源数据信息被毁坏。只能等所有硬盘镜像实现后,通过同一条带进行xor
以及依据文件系统上下文关系手动修复被损坏的文件系统。
5、尽管6号盘镜像实现,然而先前所做的镜像策略会主动跳过一些不稳固扇区,所以6号盘的镜像是不残缺的。从新调整拷贝策略持续镜像被跳过的扇区,实现6号盘所有扇区镜像。
6、实现所有硬盘的镜像后,北亚企安数据恢复工程师对ext3文件系统进行逆向剖析,联合对日志文件的剖析,最终获取到16块盘的盘序,RAID块大小,RAID的校验走向和形式等RAID相干信息。
7、利用获取到的RAID相干信息虚构重组RAID,重组实现后解析ext3文件系统,通过和用户沟通后提取出oracle的dmp文件并尝试进行复原。在应用dmp文件进行复原的过程中,oracle报告imp-0008谬误。北亚企安的oracle工程师剖析dmp文件的日志文件后发现提取出的dmp文件有问题。
8、从新剖析raid构造,进一步确定ext3文件系统被毁坏的水平。通过数据恢复工程师团队的不懈努力,终于从新提取出dmp文件和dbf原始库文件。将提取进去的dmp文件移交给用户,导入数据进行测试没有发现问题。对复原进去的dbf原始库文件进行校验,所有文件均通过测试。本次数据恢复工作实现。