服务器数据恢复环境:
北京某科技大学,某品牌 PowerEdge 系列某型号服务器,6 块 SAS 硬盘组成 RAID5;
操作系统 REDHAT,文件系统 EXT3,分区采纳 LVM 形式,存储着该大学某研究室运算 1 年多的重要数据。
服务器故障 & 剖析:
未知起因导致服务器解体。管理员进入 RAID 管制界面查看发现 1 号盘与 6 号盘状态显示损坏。征询服务器原厂工程师后,管理员强制上线 6 号盘,后果 raid 无奈启动(操作系统也装置于此 RAID)。管理员意识到问题严重性,马上进行所有操作。
依据用户的形容及故障体现,北亚服务器数据恢复工程师推断本案例中的 RAID5 阵列中应该有一块硬盘早离线,这时候磁盘阵列还能失常工作,起初又有一块硬盘离线,从而导致 RAID 阵列解体。依照管理员的形容,6 号盘早离线,1 号盘后离线。
如果下面的推断属实,1 号盘只有能失常读取即可复原全副的数据。但管理员强制上线 6 号盘,可能会导致文件系统不统一,引起其余盘的数据产生变更。
通过钻研,北亚数据恢复工程师敲定了复原数据的思路:
首先检测所有硬盘状态,剖析 RAID 信息,剔除掉古老数据盘。依据剖析进去的 RAID 信息重组 RAID,读取数据;或间接以 EXT3 的模式复原数据。
服务器数据恢复过程:
1、服务器数据恢复工程师拿到故障服务器硬盘后以只读形式对所有硬盘做镜像备份,应用不含 RAID 性能的 SAS 适配器作为物理连贯进行备份。后续数据恢复操作都在备份文件上进行,防止对数据造成二次挫伤。
2、基于镜像文件对 RAID 构造进行剖析,获取到原始 RAID 相干信息。
3、对 RAID 进行一致性校验,后果发现大量的不匹配。
4、从 6 块盘中剔除掉古老盘。但此时发现前局部区构造的内容谬误,应该为强制上线 6 号盘所导致的问题。
5、修改硬盘构造,将 LVM 改为一般分区指引。
6、通过北亚自主研发软件解释 EXT3 并读取数据,以 SAMBA 形式导出至 LINUX EXT3 指标分区。到此步数据恢复曾经实现。
7、通过用户亲自检测没有发现问题,帮助用户把数据导入筹备好的环境中,一切正常。