乐趣区

关于云计算:存储大师班-浅谈数据保护之快照与备份

作者简介:徐林波
NeonSAN 开发人员,具备丰盛的存储畛域从业教训,资深存储系统软件研发工程师,相熟以后支流及新型存储介质。

引言

面对以后企业数字化转型浪潮,信息数据曾经成为企业赖以生存的根底,数据损坏或失落将给企业带来难以估计的巨大损失。存储系统中的数据保护技术,如数据快照与备份,即为应答这一挑战的必备个性。

相比备份个性,快照作为更加底层的技术,具备十分宽泛的利用,例如作为备份的源、作为数据挖掘的源、作为保留应用程序状态的检查点,甚至就是作为单纯的数据复制的一种伎俩等。

快照技术

存储网络行业协会 SNIA(StorageNetworking Industry Association)将快照技术定义为:对于指定数据汇合的一个齐全可用拷贝,该拷贝包含相应数据在某个工夫点(拷贝开始的工夫点)的映像;快照能够是其所示意的数据的一个正本,也能够是数据的一个复制品。

与照相机一样,快门一闪,就把刚刚的人像停留在了相片上。存储系统中的数据快照与咱们生存中所说的“照片”十分类似,所不同的是,快照的对象不是人,而是数据。就如同照片留住了咱们过来的摸样和岁月,快照把数据在某一时刻的映像保留了下来。

为什么要应用快照呢?快照其实也能够了解为数据的一种刹时备份,利用它能够实现惯例备份软件无奈实现的分钟级别的 RPO;同时用户能够通过创立定时主动快照,并且把快照作为数据近程备份的源,在须要回滚时,疾速回滚到指定的工夫点上来,从而大大的进步了业务零碎可用性。

快照依照分类能够分为全量快照和增量快照,全量快照是实现所有数据的一个残缺的只读正本,增量快照是基于全量快照的一个差异化数据影像。

在存储系统中,快照能够在不同层面实现,如在磁盘阵列、文件系统、卷管理器、NAS 零碎或备份零碎等中央来实现。为了升高快照所占用的存储空间,以后罕用的为写时复制(COW,Copy-On-Write)和写重定向(ROW,Redirect-on-Write)快照技术。另外,还呈现了其余一些快照技术的实现形式,如镜像拆散、日志、继续数据保护等,这些形式,能够晋升快照的某一方面的相干个性,以应答一些非凡的场景。

上面以卷管理层实现的快照为例子,介绍两种次要的快照技术。

一 COW 快照

COW 技术也称为第一次写时复制技术,如图 1 所示,当数据第一次写到某个存储地位时,首先会将这个地位原有的数据复制一份到快照空间(为快照调配的存储空间),随后才会将数据写入该存储地位,下一次的写入则不会再执行写时复制动作,实现了保留原始数据的成果。


图 1 COW 快照

COW 实现的快照,其源卷的数据分布不会发生变化,实时更新的是快照卷的元数据信息,源卷的读性能不受影响;但写入时,因为每次都须要拷贝后再写入,理论是产生了一次读两次写,因而写性能受到影响。

二 ROW 快照

ROW 又称指针重映射快照,这种实现形式与 COW 十分类似,区别在于对原始数据卷的首次写操作将被重定向到预留的快照空间。如图 2 所示,当数据被首次重写时,ROW 会抉择一个新的地位,同时指向该数据的指针也被从新映射,指向更新后的数据。


图 2 ROW 快照

ROW 实现的快照,其源卷的数据分布始终在发生变化,源卷的元数据信息实时更新,不会有额定的拷贝数据动作,卷的最新数据在快照卷上,在对卷数据进行读操作时须要重定向到最新地位。因而 ROW 对读性能有肯定的影响,对写无影响;另外在删除快照时,快照数据须要拷贝到源卷,有肯定的耗时,因而,依据快照数据的大小,删除操作执行的工夫也会有变动。

三 COW 与 ROW 技术比照

在利用场景适应性上,由表 1 可见,COW 适宜读密集型业务,ROW 适宜写密集型业务。

备份技术

在数据保护中,对数据进行备份是极为常见的一种做法,常见的备份问题其实都能够基于快照 + 复制技术来解决,备份依照其爱护的层级分为业务级、利用级和数据级。依照备份时的零碎状态是否在持续解决业务,能够分为在线备份和离线备份,也能够称冷备份和热备份。备份依照业务能够分为齐全备份(也称全量备份)、增量备份、差别备份。如图 3 所示,齐全备份为上一个时刻点上的全量数据;差别备份为上一次齐全备份后的变动数据;增量备份为上一备份点(齐全备份、差别备份、增量备份)之后有变动的数据。

图 3 备份类型

备份技术在业界应用更多的是拉远的在线数据备份技术,即近程备份。近程备份个别会用到近程复制的技术,包含同步复制、异步复制。其中同步近程复制,须要在主从存储 IO 都写实现的状况下返回至下层利用,以保证数据的一致性;而异步近程复制是在 IO 下发至主端存储缓存后就反馈以后 IO 写实现,数据复制到从端是在后盾异步执行的。

备份经常和容灾技术一起提出,更多是作为一个整体的灾备解决方案。灾备解决方案依据不同的业务场景会有不同的部署形式。但不论是怎么的解决方案,掂量容灾备份零碎有两个要害的技术指标,RPO(Recovery Point Objective):即数据恢复点指标,次要指的是业务零碎所能容忍的数据失落量。RTO(Recovery Time Objective):即复原工夫指标,次要指的是业务所能容忍的进行服务的最长工夫,也就是从劫难产生到业务零碎复原服务性能所须要的最短时间周期。

总结

快照和备份都是数据保护的一种伎俩,但却是两种不同的概念。快照是数据存储的某一时刻的状态记录,而备份则是数据存储的某一个时刻的正本;因为快照只是记录了一个状态,因而快照的速度比备份要快得多,且采纳 COW 或 ROW 当前,快照占用的空间比备份要少;然而备份是一个随时可用的正本,可应答原始数据毁坏的状况,其安全性比快照更高。另外,从技术栈的角度上看,个别备份都会依赖快照,备份更像一种行为,而快照则是具体的技术手段。

更多文章

存储巨匠班

对象存储手把手教五 | 数据存取与加密

gg: 像写 Golang 一样生成代码

QingStor 招聘存储测试 / 运维 / 研发工程师

本文由博客一文多发平台 OpenWrite 公布!

退出移动版