关于数据恢复:北亚数据恢复分布式存储hbase和hive数据库底层文件被误删除的数据恢复案例

分布式存储环境：

Dell PowerEdge机架式服务器；
数据库类型：Hbase、Hive；
16台物理服务器。

故障：

16台服务器节点，在每台物理服务器上均匀有3台虚拟机，在虚拟机上配置分布式，下层部署的hbase数据库和hive数据库。数据库底层文件被误删除，导致数据库不可用。管理员分割北亚数据恢复核心复原hbase和hive数据库的数据。

分布式存储数据恢复过程：

通过现场对环境的简略检测，北亚数据恢复工程师发现虚拟机还能够失常启动，然而虚拟机上部署的数据库块文件失落。块文件失落之后整个集群环境没有新的数据写入，底层数据损坏可能性比拟小，具备较大的可恢复性。因为还没有对底层构造进行剖析，再加上hbase和hive的算法和底层构造十分复杂，复原概率无奈精确判断。

1、备份：
A、将存储设备断电、关机，对物理服务器底层做备份。
B、从虚拟机层面备份，通过网络间接备份虚拟机底层磁盘文件。
C、北亚数据恢复工程师筹备了一台数据恢复服务器，在这台数据恢复服务器上以只读形式挂载原服务器的硬盘，应用北亚磁盘备份工具进行残缺的扇区对扇区的备份。
D、备份实现后，由北亚数据恢复工程师提供具体报告，而后将原服务器硬盘交还给管理员。

2、块文件构造剖析：
A、对每个虚拟机磁盘的块文件进行剖析；
B、剖析文件底层的聚合形式；
C、剖析每个磁盘中数据的散布状况。

3、Block文件key剖析：
A、定位数据库文件中的key信息；
B、提取并解析数据库文件中key信息；
C、整合数据库文件key信息。

4、Block文件拼接：
A、依据Block文件的key信息提取文件片段；
B、对Block文件的片段进行拼接；
C、校验拼接后的Block文件的正确性。

5、Block文件导入：
A、校验提取出的Block文件完整性及正确性；
B、把提取进去的Block文件导入到hbase和hive数据库中。

6、数据验证：
A、由管理员对复原进去的数据进行具体验证；
B、如发现新问题，则复盘数据恢复过程查找问题起因并加以解决。

北亚数据恢复服务：
1、整个过程不会对原盘有任何的写操作，以确保原盘的数据安全；
2、尽最大可能保障服务的操作可逆，确保人力可控范畴内操作可回溯；
3、提供前期数据保存和服务跟踪；
4、以上所有操作在有备份的状况下进行，若不胜利不影响其余数据恢复计划的进行。

本次数据恢复周期：

关于数据恢复:北亚数据恢复分布式存储hbase和hive数据库底层文件被误删除的数据恢复案例

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据恢复:北亚数据恢复分布式存储hbase和hive数据库底层文件被误删除的数据恢复案例

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复