共计 1203 个字符,预计需要花费 4 分钟才能阅读完成。
服务器数据恢复环境:
NetApp 某型号存储,共 96 块 SAS 硬盘,划分的 lun 都映射给小型机应用,寄存的是 Oracle 数据库文件,采纳 ASM 裸设施存储形式。
服务器故障:
管理员误操作删除了该 NetApp 存储上的所有 lun。具体情况是:工作人员给 NetApp 存储设备从新划分空间,间接把存储的卷全副删除并进行重新分配。在删除所有卷后还没有来得及调配的时候,下层业务就出现异常。运维工程师紧急排查故障状况,发现业务服务器上的磁盘都不见了,无法访问数据。
服务器数据恢复过程:
1、为了预防在数据恢复过程中可能对原始磁盘数据造成的二次毁坏,将该 NetApp 存储上的每块磁盘以只读形式做残缺镜像。后续所有的数据分析和数据恢复操作都在镜像文件上进行。
2、基于镜像文件剖析 Netapp 存储数据。
a、剖析盘序和 LVM 的组成形式;
b、扫描硬盘内的所有节点,个别只扫描“MBFI”。
c、在节点扫描后果中找到文件大小合乎需要的节点并提取此节点 uid,并判断索引根。
d、依据索引根内的第一级数据指针提取本文件的所有间接数据指针(须要参考节点中 0x03 地位的 MAP 深度。为 0x00 时间接从节点内提取数据,为 0x01 时须要提取一次 MAP,为 0x02 时须要提取两次 MAP……)。在指针提取结束后开始提取文件数据。
3、解析超级块。在硬盘的后面扇区的地位找到超级块相干信息,从超级块中获取到磁盘组名字、磁盘组的逻辑起始块号、总块数、磁盘组中 raid 的编号。
netapp 超级块信息:
4、剔除校验盘。
每个数据块占 8 个扇区,数据块后附加 64 字节数据块形容信息。依据这些信息能够判断出作为校验盘(提取数据时校验盘需剔除)的磁盘。
校验块形容信息:
5、判断 aggr 盘。
确定各个磁盘所属 aggr 组,而后判断组内盘序(根据每块磁盘 8 号扇区的磁盘信息以及磁盘开端的 RAID 盘序表确定盘序)。数据指针跳转时不思考校验盘,所以只获得数据盘的盘序即可。
netapp 盘序表:
6、剖析节点及节点头部信息。
Netapp 的节点散布在数量泛滥的数据块内,在数据块内又被对立组织为节点组。每个节点组的前半部分字节记录零碎数据,后半局部字节记录各个文件节点。依据用户级别可将节点分为两类:“MBFP”系统文件节点和“MBFI”用户文件节点,在数据恢复时个别只取 MBFI 节点组即可。
netapp 节点样:
7、获取目录项,并依据目录项节点编号找到对应节点。
目录项信息:
8、剖析出该 Netapp 存储构造后,用北亚企安自研的 NetApp 解析程序解析 asm 文件系统,提取出 oracle 数据库文件。
9、搭建小机环境并装置 oracle 数据库,检测提取进去的数据库文件和备份文件。
10、应用提取出的数据库文件启动 oracle 数据库,启动失常。
11、应用最新的数据库备份文件还原数据库,而后由用户方亲自进行验证,通过重复验证,用户方确认复原进去的 oracle 数据库数据残缺可用,数据恢复工作实现。