分布式存储环境:
Dell PowerEdge 机架式服务器;
数据库类型:Hbase、Hive;
16 台物理服务器。
故障:
16 台服务器节点,在每台物理服务器上均匀有 3 台虚拟机,在虚拟机上配置分布式,下层部署的 hbase 数据库和 hive 数据库。数据库底层文件被误删除,导致数据库不可用。管理员分割北亚数据恢复核心复原 hbase 和 hive 数据库的数据。
分布式存储数据恢复过程:
通过现场对环境的简略检测,北亚数据恢复工程师发现虚拟机还能够失常启动,然而虚拟机上部署的数据库块文件失落。块文件失落之后整个集群环境没有新的数据写入,底层数据损坏可能性比拟小,具备较大的可恢复性。因为还没有对底层构造进行剖析,再加上 hbase 和 hive 的算法和底层构造十分复杂,复原概率无奈精确判断。
1、备份:
A、将存储设备断电、关机,对物理服务器底层做备份。
B、从虚拟机层面备份,通过网络间接备份虚拟机底层磁盘文件。
C、北亚数据恢复工程师筹备了一台数据恢复服务器,在这台数据恢复服务器上以只读形式挂载原服务器的硬盘,应用北亚磁盘备份工具进行残缺的扇区对扇区的备份。
D、备份实现后,由北亚数据恢复工程师提供具体报告,而后将原服务器硬盘交还给管理员。
2、块文件构造剖析:
A、对每个虚拟机磁盘的块文件进行剖析;
B、剖析文件底层的聚合形式;
C、剖析每个磁盘中数据的散布状况。
3、Block 文件 key 剖析:
A、定位数据库文件中的 key 信息;
B、提取并解析数据库文件中 key 信息;
C、整合数据库文件 key 信息。
4、Block 文件拼接:
A、依据 Block 文件的 key 信息提取文件片段;
B、对 Block 文件的片段进行拼接;
C、校验拼接后的 Block 文件的正确性。
5、Block 文件导入:
A、校验提取出的 Block 文件完整性及正确性;
B、把提取进去的 Block 文件导入到 hbase 和 hive 数据库中。
6、数据验证:
A、由管理员对复原进去的数据进行具体验证;
B、如发现新问题,则复盘数据恢复过程查找问题起因并加以解决。
北亚数据恢复服务:
1、整个过程不会对原盘有任何的写操作,以确保原盘的数据安全;
2、尽最大可能保障服务的操作可逆,确保人力可控范畴内操作可回溯;
3、提供前期数据保存和服务跟踪;
4、以上所有操作在有备份的状况下进行,若不胜利不影响其余数据恢复计划的进行。
本次数据恢复周期: