关于存储:天翼云对象存储ZOS高可用的关键技术揭秘

57次阅读

共计 2224 个字符,预计需要花费 6 分钟才能阅读完成。

对象存储是一种将数据作为对象进行治理的网络存储架构,晚期常被用于数据备份归档等场景。

对象存储是一种将数据作为对象进行治理的网络存储架构,晚期常被用于数据备份归档等场景。随着各行业数字化转型深刻,非结构化数据出现爆发式增长,对象存储作为可能提供可大规模扩大且经济高效的存储计划,其利用愈发宽泛,逐步深刻政务、金融等客户的外围业务畛域,这也对对象存储的可靠性、可用性提出了更高要求。

基于高牢靠的底座、齐备的平安防护、一体化的运维治理与容灾设计体系,天翼云对象存储 ZOS 为企业提供高可用、高牢靠的存储服务,应答数据爆发式增长和疾速查问需要,保障更多政企客户平安用云。

天翼云对象存储 ZOS 整体可用体系建设图
天翼云对象存储 ZOS 采纳分布式系统架构设计,具备灵便伸缩的接入层和高牢靠的分布式架构,可进一步晋升存储服务可用性。

灵便伸缩的接入层
ZOS 可能反对海量的小文件拜访和存储。高达 10 亿 + 数据量的单桶存储,是对对象存储产品前端接入网络高负载、高可用性的挑战。天翼云 ZOS 通过一整套基于 CStor-LVS 和 CStor-Nginx 的架构来满足这一需要。

如上图所示,ZOS 通过前端接入全互联高速网络,实现了各个节点在负载上的完满平衡。接入节点间通过 keepalived 的形式实现了 LVS 节点之间的高可用,在面对单节点故障的场景时,可能迅速做出切换,保障业务的连续性,服务可靠性高达 99.995%。同时,在 Router、LVS 和 Nginx 侧,别离实现了各自的一致性 Hash,在前端流量持续增长的同时,可能实现用户无感知的热伸缩。

高牢靠分布式架构
当 ZOS 进行文件存储时,会以对象的形式将每个文件切片,并通过 Hash 计算保障这些分片平均离散地映射到每个存储节点、每块硬盘上。在存储单元的选取上,能够依据每个硬盘所在服务器、机架、机房进行识别性选取,进而在多个物理层级上满足服务可靠性的要求。

在底层架构上,ZOS 反对多正本和 EC 纠删码的策略,在充分保证数据准确性、安全性的同时,能够依据须要灵便抉择冗余的类型,在容量利用率、性能、可靠性上达到满足客户需要的均衡。
天翼云对象存储 ZOS 实现高可用还得益于一项关键技术:反对 3AZ 多活架构。

回顾数据存储的灾备技术倒退,次要分为以下几个阶段:
离线备份:技术倒退的晚期,人们次要通过移动硬盘、光盘进行数据离线备份(也称为冷备份),实现简略,无需进行大规模的业务部署和革新,但也存在效率低下、安全性可靠性低且复原艰难等问题。随着行业内数据量的激增以及磁带库等备份介质的呈现,市场涌现了少量的备份软件厂商,可实现大规模数据的自动化离线备份和复原。

在线备份:因为离线备份须要中断在线业务,且复原操作实现简单,备份厂商联合利用侧研发出在线备份技术(也称为热备份)。在线备份施行时无需中断用户业务,联合快照可能便捷地为用户提供数据强一致性的备份和恢复能力。然而这种形式同样存在数据备份和复原周期长的问题。

两站点双活 & 复制:在备份技术倒退的同时,数据存储畛域也呈现了跨站点的容灾技术,最先呈现的是两站点的双活、异步 & 同步复制技术,具备数据在线复制备份、故障复原工夫短等劣势。

跨站点多活:随同着业务可靠性要求的继续升高,多站点多活技术随之诞生,带来了比两站点容灾更高的可靠性能力。传统技术包含两站点构建双活+额定一站点复制等。

比照几种灾备技术特色能够发现,在业务复原难度和时长方面,因为备份波及屡次的数据拷贝和回拷,复原难度较高且耗时较长;在资源利用率方面,利用传统备份和复制技术,备份数据目标端通常不间接承载现网业务,会造成局部业务资源节约;在运维老本方面,双活、多活技术故障场景业务感知小,切换迅速快捷,且无需人工设置备份 / 复原规定,更不便客户侧运维人员操作和施行。
另外,备份和传统跨站点容灾技术实际上还是基于数据复制技术实现的,通常至多须要 1:1 的数据备份,借助压缩又会带来额定的开销,因而整体的存储空间利用率也不高。但在理论应用中,很多用户出于投资老本和可靠性要求等多方面思考,也会将备份和跨站点容灾技术联合应用。

ZOS 为适应云上业务的极速倒退和高可用要求,在跨站点多活技术的根底上,研发实现了 3AZ(Available Zone,云上架构下的可用区,通常为一个物理站点)多活的容灾架构能力,每个 AZ 存储节点交融为对立的存储系统,AZ 间实现数据自在流动,对外提供无差别的对象存储服务。

ZOS 在 3AZ 多活能力上具备以下几大技术劣势,在保有传统跨站点多活技术高可靠性的根底上,为用户提供更好的资源可用性和运维体验。

业务无中断:三站点多活架构,任意一个站点整体故障业务不中断,满足生产零碎业务稳固运行的高牢靠要求。

故障无感知:站点故障后业务主动切换,下层利用无感知,体验更优。

复原无干涉:站点复原后,无需人工干预主动从新上线,零碎主动进行数据重构,利用失常安稳运行。

资源高可用:通过跨站点分布式纠删技术,充分利用各站点存储空间;3 站点多活同时承载业务,提供更优于双活 & 复制的存储资源利用率。

可视化运维:云上可视化监控状态和告警,轻松实现近程运维。

目前,天翼云在华北、西安、苏州等全国多地实现了 3AZ 部署。
随着千行百业数字化转型过程的一直减速,云上业务连续性和可用性已成为企业深入信息化建设、保障业务可继续倒退的重要着力点。天翼云对象存储 ZOS 可为企业提供低成本、高可用、易运维的对象存储服务,让企业数据存储无后顾之忧,在数字时代的博弈中稳中求胜。

正文完
 0