一、raid5 常见故障介绍
- 服务器硬件呈现故障或者 RAID 阵列卡故障;
- 服务器意外断电导致磁盘阵列故障;
- 服务器阵列上的磁盘呈现物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;
- 管理员在保护服务器过程中因为误操作导致硬盘盘序呈现谬误;
- raid 在同步数据或者重建过程中,同组 raid 阵列中有其余硬盘掉线导致同步失败;
-
配置 raid 阵列信息出错等误操作导致数据失落。
二、RAID5 磁盘阵列故障后须要留神哪些问题
1. RAID5 磁盘阵列呈现故障或者数据失落后倡议不要自觉进行 rebuild 操作。
Rebuild 操作就是利用阵列的校验性能,依据阵列内其余失常硬盘内的数据,将损坏硬盘的数据进行计算生成并同步到热备盘中。这种操作适宜阵列中有 1 块硬盘掉线的状况,一旦阵列中有 2 块硬盘呈现故障掉线了,则通常掉线程序有先有后,如果在第一块硬盘掉线后服务器曾经进行过写入操作的话,此时第一块掉线的硬盘数据曾经久不更新,rebuild 只能对先掉线的磁盘做 Rebuild,如果对后掉线的磁盘进行重建操作,局部阵列尽管能失常工作,但数据错乱,一些文件不能关上,给用户带来不可挽回的损失。
2. 如果有硬盘掉线不倡议自觉进行强制上线操作。
在北亚数据恢复核心复原的 raid5 数据恢复案例中,有局部 raid 阵列数据失落起因是因为阵列中有一块硬盘离线当前没有及时更换硬盘,尔后服务器呈现故障或者失常重启,本来离线的硬盘从新上线,而本来在线的硬盘反而故障离线,数据不能失常应用。
用户对后离线的硬盘进行强制上线操作,磁盘阵列进行主动同步,导致数据新旧凌乱,服务器数据失落。因为原来离线的盘又主动上线,大多数阵列卡会测验校验信息,一旦发现校验信息不正确,会从新计算校验信息,以致不能缺盘复原数据,将会数据恢复失败。3. 千万不要进行初始化操作。
初始化是一种相似于低级格式化的操作,一旦对阵列进行初始化操作,那么这个阵列内所有硬盘的底层数据将全副被清零,此时将导致阵列数据无奈复原。
4. 重新配置磁盘阵列信息时要保障与原始配置信息统一。
如果须要重新配置磁盘阵列信息时,肯定要留神与原始配置信息保持一致,一旦重新配置的参数与原始信息不统一,将导致阵列内少数文件无奈关上,造成数据失落。并且少数服务器都有重新配置阵列信息后主动初始化的性能,这将导致数据无奈复原。
5. 在进行数据恢复尝试前请务必对服务器内的所有硬盘进行扇区级的镜像备份,防止毁坏原始数据,如果有条件,能够分割数据恢复核心获取技术领导。
三、RAID5 故障数据恢复计划
- 镜像服务器内所有数据。
依照肯定的程序将服务器内的所有硬盘进行排序编号,而后将每块硬盘进行镜像备份,也能够将服务器携带至北亚数据恢复核心,由数据恢复工程师进行镜像操作。 - 将镜像文件交给数据恢复核心进行底层数据分析,重组 raid 阵列,导出用户数据。
- 对导出的所有数据进行验证,确认无误后从新搭建服务器环境,将复原的数据迁徙回服务器内即可。