弹性计算Region化部署和跨可用区容灾自身是非常复杂的课题,本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍如何抉择Region,同时联合阿里云在Region化部署和跨可用区容灾的实践经验,分享多region部署场景中如何应用阿里云弹性计算的最佳实际,并联合弹性计算的实践经验探讨如何基于阿里云多可用区实现跨地区容灾。

一、Region和可用区介绍

该局部次要介绍Region和可用区,包含阿里云建设Region和可用区的起因、划分等。

1.Region(地区)与Available Zone(可用区)

Region(地区):依据定义,Region是互相独立的天文区域,Region中蕴含多个Available Zone。可通过阿里云Region和可用区分布图直观理解。

Available Zone(可用区):Available Zone是Region内网络和电力互相独立的区域,具备两个次要特点。第一,Available Zone网络和电力互相独立,具备故障隔离能力。当一个可用区外部网络、电力呈现问题时,不会影响其余可用区。第二,雷同Region内的可用区之间内网互通,通过高速网络连接,网络提早低(ms级)。

即可用区之间有故障隔离,同时雷同Region内的可用区之间网络提早较低,能够将多个可用区视为整体提供服务,也为后续做跨可用区容灾提供了根底。
此处须要指明,并不是先规定了地区和可用区后才发现可反对高可用服务建设,而是在有高可用服务需要的根底上通过Region与可用区形式进行了资源划分。

2.如何抉择Region?

抉择一个Region有以下三点重要影响因素:

第一,地区抉择须要合乎相应政策和法律合规性须要。例如向美国提供服务,要求对应数据与服务器资源必须在该国家外部,那么依据下方Region与可用区散布,只能申请美西、美东两处资源。
第二,须要依据所需云产品在各个地区的性能开明状况和SLA抉择适合区域。
第三,个别抉择间隔用户更近且网络提早更低的地区,保障用户疾速接入。

尽管Region的抉择看似条款化,然而理论抉择时是更为简略直观的,较易失去最优抉择。

3.阿里云Region与可用区散布

目前为止,阿里云公共云在寰球建设21个地区63个可用区,资源正在快速增长中,将来将反对更多状态。

下图所示体现了阿里云在寰球多个地理位置提供服务的能力,可见Region是一个天文概念。例如当用户在华北2(北京)Region购买资源时,对应的ECS、RDS产品确实是在该地区范畴内。

目前Region与可用区散布较集中在中国,其余国家地区也有散布,在南美与非洲短少Region建设,是后续的倒退方向。

而Region的应用稍显简单。与各个Region交会并不间接应用其名字,而是通过REGION_ID。REGION_ID看似芜杂,其实具备肯定特点,可大抵分为以下三种:

中国REGION_ID为cn-(城市名),如cn-hangzhou。
大面积国家REGION_ID为(国家代码)-(方位)-(编号),如USA-EAST-2。
其余地区REGION_ID为(地区)-(方位)-(编号)。

二、Endpoints和资源作用域

该局部介绍应用Region与可用区时须要关注的两个关键点:Endpoints和资源作用域。

1. Endpoints

Endpoints是调用ECS API的接入地址。

调用ECS API首先须要获取Endpoints,即须要晓得须要调用的地区的域名,能力调用到相应服务。第二须要有AK,通过某种阿里云特定的算法对调用串做一些加签。如此便能够实现一次申请。

如下表所示,依据不同Region类型,Endpoints接入形式有如下三种:

第一种类型是核心域名Region,其接入点域名地址是ecs.aliyuns.com。此类老地区应用兼容模式只能通过核心域名接入,如cn-beijing。
第二种类型是Region化域名,其接入点为Region化域名地址ecs.${REGION_ID}.aliyuns.com。此类Region应用Region化域名调用,兼容核心域名接入,如cn-zhangjiakou。
第三种类型开始思考不兼容核心域名接入的Region化域名,只能通过Region化域名地址ecs.${REGION_ID}.aliyuns.com接入,如cn-heyuan。

针对以上三种类型Region的接入失去了最佳实际。非核心域名的地区,倡议应用Region化域名地址ecs.${REGION_ID}.aliyuns.com。局部Region只能应用核心域名拜访,后续会之间切换为Region化域名。

2.资源作用域

应用ECS过程中会有多种资源,每一种资源有其特定的作用域。

下表列举了局部资源。如账号、角色、AK此类为全局性信息,所有Region共享。实例、云盘为可用区级别的概念,创立实例、云盘都须要抉择一个特定的可用区,然而实例只能挂载雷同可用区的云盘。快照、镜像资源、keypair、平安组的作用域均为Region,在Region内各个可用区均可拜访。当须要跨Region应用快照、镜像资源时,须要先进行资源复制操作,在另一个Region上造成新资源才能够应用。

资源作用域并非规定成章,有时会存在变动,大部分期间是上述情况。

三、多可用区容灾和Region化部署

该局部介绍如何利用Region与可用区地区散布以及可用区电力、网络故障隔离和低提早的特点实现多可用区容灾和Region化部署。

1.跨可用区容灾——冷备形式

冷备形式指两个可用区,一个主可用区运行,一个不运行作为备份。一旦运行中的可用区服务故障,部署并运行备份可用区。冷备形式较易实现,其毛病为主备切换耗时大(分钟级)。

单可用区提供服务:如下图所示,可用区a和可用区b同时提供两套服务,由单可用区提供服务。失常状况下可用区a提供服务,可用区b的ECS服务不进行部署和运行,对应的SLB没有流量。流量从DNS解析到可用区a的SLB,接入申请后SLB会散发到某个ECS。

RDS主备架构:两个ECS拜访同一个RDS,RDS采纳主备构造,主RDS提供读写服务,同时有一条门路主动同步数据到备RDS,保障两个可用区的数据一致性与及时性,为容灾切换提供根底。

无状态服务:ECS部署无状态服务,所有业务状态存储在数据库中或可从数据库复原。如此能力在可用区a故障时将整个业务切换到可用区b。

故障复原计划:可用区a、b存在电力、网络的物理隔离,提早低,产生可用区级别故障时可切换可用区提供服务。可用区a产生问题时,部署并运行可用区b服务,RDS主备切换,可用区a复原后可持续进行数据同步。切换DNS,可用区b SLB接管流量开始提供服务。

劣势:冷备形式比单纯的单个可用区提供服务有更强的容灾能力,然而其毛病是切换可用区启动ECS、启动服务等、运行SLB等等操作消耗肯定工夫,属于分钟级别的容灾。

2.跨可用区容灾——双活形式

双活容灾形式与冷备形式区别在于两个可用区同时运行,数据同步。一旦某一可用区服务故障,另一可用区持续提供服务。双活形式同样易于实现,且主备切换耗时低(s级)。

双可用区同时提供服务:如下图所示,有可用区a和可用区b同时提供两套服务。SLB同时挂载两个可用区的ECS服务,每个可用区的SLB须要将申请分发给两个可用区的ECS。

RDS主备架构:主动同步数据,保障两个可用区的数据一致性与及时性。失常状况下两可用区服务均拜访RDS主节点。

无状态服务:ECS部署无状态服务,所有业务状态存储在数据库中或可从数据库复原。

故障复原计划:当一个可用区产生问题时,RDS可主动主备切换。DNS定时检测SLB状态,屏蔽故障可用区,SLB定时检测ECS服务状态,屏蔽故障服务。该场景下大部分检测主动实现,局部简单场景下可能须要手动确认故障,然而该切换过程迅速,可实现秒级切换。

以上两种跨可用区容灾形式较为实用、常见,实现条件均是可用区之间具备网络、电力的物理隔离以及低提早特点。

3.跨Region部署

此处仅介绍较为简单的跨Region部署模式。

首先进行地区划分。Region化部署实现后,每个Region中由可用区容灾的集群保障高可用性。然而客户端调用地区时一个Region不能反对所有用户与资源拜访。因而首先须要依据用户或者资源所属地区进行划分,通过DNS服务获取Region化地址。该DNS可能是阿里云提供的服务或其余服务,DNS依据用户或资源返回相应的Region化地址。

例如某用户拜访Region 1,则调用Region 1的服务提供相应反对,某用户拜访Region 2,则调用Region 2的服务提供相应反对。

Region内双可用区容灾。地区划分实现后,当可用区级别问题扩充到Region级别问题场景下,并未提供Region级别容灾能力,然而提供了隔离能力。例如当Region1产生问题,无奈切换到Region2进行容灾,然而能够实现隔离,当Region 1呈现问题时Region 2不受影响,即可能保留一部分工作服务的能力。

若须要提供Region级别容灾能力,须要实现跨Region的数据同步或复制,将一个Region的数据、用户状态等复制到另一个Region,即可实现Region切换。如此将更加简单。Region级别容灾等简单计划此处不做介绍,有趣味者可自行查阅材料。

故障影响和复原。用户最终抉择的容灾形式、故障隔离级别、故障复原计划等须要依据本身业务需要、实现难度与故障概率等进行判断,抉择最适宜本身业务的计划。

综上所述,本次分享介绍了Region、可用区的定义、故障隔离与低提早个性、关键点以及跨可用区容灾等基本概念。大家能够利用阿里云的基础架构以及业务相应反对进步服务可用性,在肯定级别实现容灾,提供更好的服务。

感兴趣的同学可通过学习更加具体的场景下不同跨可用区容灾计划,更加深刻理解跨Region容灾。

原文链接
本文为阿里云原创内容,未经容许不得转载。