关于javascript:玩转ECS第6讲-弹性计算Region化部署和跨可用区容灾介绍

6次阅读

共计 4045 个字符,预计需要花费 11 分钟才能阅读完成。

弹性计算 Region 化部署和跨可用区容灾自身是非常复杂的课题,本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍如何抉择 Region,同时联合阿里云在 Region 化部署和跨可用区容灾的实践经验,分享多 region 部署场景中如何应用阿里云弹性计算的最佳实际,并联合弹性计算的实践经验探讨如何基于阿里云多可用区实现跨地区容灾。

一、Region 和可用区介绍

该局部次要介绍 Region 和可用区,包含阿里云建设 Region 和可用区的起因、划分等。

1.Region(地区)与 Available Zone(可用区)

Region(地区):依据定义,Region 是互相独立的天文区域,Region 中蕴含多个 Available Zone。可通过阿里云 Region 和可用区分布图直观理解。

Available Zone(可用区):Available Zone 是 Region 内网络和电力互相独立的区域,具备两个次要特点。第一,Available Zone 网络和电力互相独立,具备故障隔离能力。当一个可用区外部网络、电力呈现问题时,不会影响其余可用区。第二,雷同 Region 内的可用区之间内网互通,通过高速网络连接,网络提早低(ms 级)。

即可用区之间有故障隔离,同时雷同 Region 内的可用区之间网络提早较低,能够将多个可用区视为整体提供服务,也为后续做跨可用区容灾提供了根底。
此处须要指明,并不是先规定了地区和可用区后才发现可反对高可用服务建设,而是在有高可用服务需要的根底上通过 Region 与可用区形式进行了资源划分。

2. 如何抉择 Region?

抉择一个 Region 有以下三点重要影响因素:

第一,地区抉择须要合乎相应政策和法律合规性须要。例如向美国提供服务,要求对应数据与服务器资源必须在该国家外部,那么依据下方 Region 与可用区散布,只能申请美西、美东两处资源。
第二,须要依据所需云产品在各个地区的性能开明状况和 SLA 抉择适合区域。
第三,个别抉择间隔用户更近且网络提早更低的地区,保障用户疾速接入。

尽管 Region 的抉择看似条款化,然而理论抉择时是更为简略直观的,较易失去最优抉择。

3. 阿里云 Region 与可用区散布

目前为止,阿里云公共云在寰球建设 21 个地区 63 个可用区,资源正在快速增长中,将来将反对更多状态。

下图所示体现了阿里云在寰球多个地理位置提供服务的能力,可见 Region 是一个天文概念。例如当用户在华北 2(北京)Region 购买资源时,对应的 ECS、RDS 产品确实是在该地区范畴内。

目前 Region 与可用区散布较集中在中国,其余国家地区也有散布,在南美与非洲短少 Region 建设,是后续的倒退方向。

而 Region 的应用稍显简单。与各个 Region 交会并不间接应用其名字,而是通过 REGION_ID。REGION_ID 看似芜杂,其实具备肯定特点,可大抵分为以下三种:

中国 REGION_ID 为 cn-(城市名),如 cn-hangzhou。
大面积国家 REGION_ID 为(国家代码)-(方位)-(编号),如 USA-EAST-2。
其余地区 REGION_ID 为(地区)-(方位)-(编号)。

二、Endpoints 和资源作用域

该局部介绍应用 Region 与可用区时须要关注的两个关键点:Endpoints 和资源作用域。

1. Endpoints

Endpoints 是调用 ECS API 的接入地址。

调用 ECS API 首先须要获取 Endpoints,即须要晓得须要调用的地区的域名,能力调用到相应服务。第二须要有 AK,通过某种阿里云特定的算法对调用串做一些加签。如此便能够实现一次申请。

如下表所示,依据不同 Region 类型,Endpoints 接入形式有如下三种:

第一种类型是核心域名 Region,其接入点域名地址是 ecs.aliyuns.com。此类老地区应用兼容模式只能通过核心域名接入,如 cn-beijing。
第二种类型是 Region 化域名 ,其接入点为 Region 化域名地址 ecs.${REGION_ID}.aliyuns.com。此类 Region 应用 Region 化域名调用,兼容核心域名接入,如 cn-zhangjiakou。
第三种类型开始思考不兼容核心域名接入的 Region 化域名,只能通过 Region 化域名地址 ecs.${REGION_ID}.aliyuns.com 接入,如 cn-heyuan。

针对以上三种类型 Region 的接入失去了最佳实际。非核心域名的地区,倡议应用 Region 化域名地址 ecs.${REGION_ID}.aliyuns.com。局部 Region 只能应用核心域名拜访,后续会之间切换为 Region 化域名。

2. 资源作用域

应用 ECS 过程中会有多种资源,每一种资源有其特定的作用域。

下表列举了局部资源。如账号、角色、AK 此类为全局性信息,所有 Region 共享。实例、云盘为可用区级别的概念,创立实例、云盘都须要抉择一个特定的可用区,然而实例只能挂载雷同可用区的云盘。快照、镜像资源、keypair、平安组的作用域均为 Region,在 Region 内各个可用区均可拜访。当须要跨 Region 应用快照、镜像资源时,须要先进行资源复制操作,在另一个 Region 上造成新资源才能够应用。

资源作用域并非规定成章,有时会存在变动,大部分期间是上述情况。

三、多可用区容灾和 Region 化部署

该局部介绍如何利用 Region 与可用区地区散布以及可用区电力、网络故障隔离和低提早的特点实现多可用区容灾和 Region 化部署。

1. 跨可用区容灾——冷备形式

冷备形式指两个可用区,一个主可用区运行,一个不运行作为备份。一旦运行中的可用区服务故障,部署并运行备份可用区。冷备形式较易实现,其毛病为主备切换耗时大(分钟级)。

单可用区提供服务:如下图所示,可用区 a 和可用区 b 同时提供两套服务,由单可用区提供服务。失常状况下可用区 a 提供服务,可用区 b 的 ECS 服务不进行部署和运行,对应的 SLB 没有流量。流量从 DNS 解析到可用区 a 的 SLB,接入申请后 SLB 会散发到某个 ECS。

RDS 主备架构:两个 ECS 拜访同一个 RDS,RDS 采纳主备构造,主 RDS 提供读写服务,同时有一条门路主动同步数据到备 RDS,保障两个可用区的数据一致性与及时性,为容灾切换提供根底。

无状态服务:ECS 部署无状态服务,所有业务状态存储在数据库中或可从数据库复原。如此能力在可用区 a 故障时将整个业务切换到可用区 b。

故障复原计划:可用区 a、b 存在电力、网络的物理隔离,提早低,产生可用区级别故障时可切换可用区提供服务。可用区 a 产生问题时,部署并运行可用区 b 服务,RDS 主备切换,可用区 a 复原后可持续进行数据同步。切换 DNS,可用区 b SLB 接管流量开始提供服务。

劣势:冷备形式比单纯的单个可用区提供服务有更强的容灾能力,然而其毛病是切换可用区启动 ECS、启动服务等、运行 SLB 等等操作消耗肯定工夫,属于分钟级别的容灾。

2. 跨可用区容灾——双活形式

双活容灾形式与冷备形式区别在于两个可用区同时运行,数据同步。一旦某一可用区服务故障,另一可用区持续提供服务。双活形式同样易于实现,且主备切换耗时低(s 级)。

双可用区同时提供服务:如下图所示,有可用区 a 和可用区 b 同时提供两套服务。SLB 同时挂载两个可用区的 ECS 服务,每个可用区的 SLB 须要将申请分发给两个可用区的 ECS。

RDS 主备架构:主动同步数据,保障两个可用区的数据一致性与及时性。失常状况下两可用区服务均拜访 RDS 主节点。

无状态服务:ECS 部署无状态服务,所有业务状态存储在数据库中或可从数据库复原。

故障复原计划:当一个可用区产生问题时,RDS 可主动主备切换。DNS 定时检测 SLB 状态,屏蔽故障可用区,SLB 定时检测 ECS 服务状态,屏蔽故障服务。该场景下大部分检测主动实现,局部简单场景下可能须要手动确认故障,然而该切换过程迅速,可实现秒级切换。

以上两种跨可用区容灾形式较为实用、常见,实现条件均是可用区之间具备网络、电力的物理隔离以及低提早特点。

3. 跨 Region 部署

此处仅介绍较为简单的跨 Region 部署模式。

首先进行地区划分。Region 化部署实现后,每个 Region 中由可用区容灾的集群保障高可用性。然而客户端调用地区时一个 Region 不能反对所有用户与资源拜访。因而首先须要依据用户或者资源所属地区进行划分,通过 DNS 服务获取 Region 化地址。该 DNS 可能是阿里云提供的服务或其余服务,DNS 依据用户或资源返回相应的 Region 化地址。

例如某用户拜访 Region 1,则调用 Region 1 的服务提供相应反对,某用户拜访 Region 2,则调用 Region 2 的服务提供相应反对。

Region 内双可用区容灾。地区划分实现后,当可用区级别问题扩充到 Region 级别问题场景下,并未提供 Region 级别容灾能力,然而提供了隔离能力。例如当 Region1 产生问题,无奈切换到 Region2 进行容灾,然而能够实现隔离,当 Region 1 呈现问题时 Region 2 不受影响,即可能保留一部分工作服务的能力。

若须要提供 Region 级别容灾能力,须要实现跨 Region 的数据同步或复制,将一个 Region 的数据、用户状态等复制到另一个 Region,即可实现 Region 切换。如此将更加简单。Region 级别容灾等简单计划此处不做介绍,有趣味者可自行查阅材料。

故障影响和复原。用户最终抉择的容灾形式、故障隔离级别、故障复原计划等须要依据本身业务需要、实现难度与故障概率等进行判断,抉择最适宜本身业务的计划。

综上所述,本次分享介绍了 Region、可用区的定义、故障隔离与低提早个性、关键点以及跨可用区容灾等基本概念。大家能够利用阿里云的基础架构以及业务相应反对进步服务可用性,在肯定级别实现容灾,提供更好的服务。

感兴趣的同学可通过学习更加具体的场景下不同跨可用区容灾计划,更加深刻理解跨 Region 容灾。

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0