关于数据恢复:北亚服务器数据恢复华为OceanStor服务器热备盘同步数据失败的数据恢复案例

7次阅读

共计 995 个字符,预计需要花费 3 分钟才能阅读完成。

服务器数据恢复环境:
华为 OceanStor 系列服务器;
24 块硬盘组成一组 raid5 盘阵,其中一块硬盘为热备盘。

服务器故障状况:
服务器运行过程中有一块硬盘离线,热备盘激活上线进行数据同步,在数据同步的过程中服务器内另一块硬盘因未知故障离线,服务器下层利用解体,服务器数据失落。服务器管理员分割数据恢复核心寻求帮忙。

服务器数据恢复过程:
1、数据恢复核心接到该故障服务器所有硬盘后马上对每块硬盘进行硬件故障检测,最终发现只有一块硬盘存在物理故障。服务器数据恢复工程师对所有硬盘做了镜像备份。
2、剖析服务器故障起因。
因为华为 s 系列服务器的控制器查看磁盘的策略相当严格,对于无物理故障但性能不稳固的硬盘会当作坏盘解决,踢出 raid 阵列。通过物理故障检测发现只有一块硬盘存在物理故障,因而该服务器掉线的两块盘中另外一块硬盘掉线是因为读写不稳固被踢出。
3、剖析服务器 raid 构造。
复原 lun 首先须要剖析底层的 raid 构造信息,依据剖析获取的 raid 信息重组 raid。服务器数据恢复工程师对每一块硬盘进行剖析,获取到 raid 阵列的条带大小、数据走向、硬盘程序、热备盘、数据库的散布法则等根底信息。
4、通过校验排查服务器内被同步硬盘。
依据曾经获取到的服务器阵列信息,数据恢复工程师应用自主研发的 raid 虚构程序进行 raid 重组。数据恢复工程师将所有硬盘进行底层数据结构比照,发现了其中一块硬盘在雷同条带上的数据与其余硬盘显著不同,应用北亚自主研发的 raid 校验程序对该硬盘进行条带校验后确认该硬盘已被同步毁坏。服务器数据恢复工程师重组 raid 阵列后剖析 lun 在 raid 组中的分配情况及数据块 map,只有可能残缺的将 map 提取就可复原 lun 数据。
5、提取服务器内数据库文件并修复数据库。
服务器数据恢复工程师自主编写了文件系统解析程序对虚构阵列内的文件系统进行解析,导出数据库文件后移交数据库工程师进行校验和修复。
数据库工程师对数据库文件进行验证发现局部数据库文件及日志文件异样。表空间内存在大量坏块,所有管制文件被毁坏,undotbs02 失落,数据库工程师只好对数据库文件进行修复,修复过程见下图:

服务器数据恢复验证:
通过数据库工程师对数据的修复和验证,最终胜利复原数据库数据,工程师将修复胜利的数据库数据导入数据恢复专用服务器进行验证,所有数据失常,分割用户亲自进行现场数据验证,确认复原进去的数据没有问题。

正文完
 0