关于云原生-cloud-native:从单体到混乱的微服务阿里云托管式服务网格是如何诞生的

15次阅读

共计 4885 个字符,预计需要花费 13 分钟才能阅读完成。

作者 | 王夕宁  阿里巴巴高级技术专家

参加阿里巴巴云原生文末留言互动,即有机会取得赠书福利!

在服务网格技术应用之前,为了更快更灵便地进行业务翻新, 咱们经常会把现有利用进行现代化革新, 把单体应用程序分拆为分布式的微服务架构。通常来说,  在微服务架构模式的变迁过程中, 最后都是面向代码库的模式。

对这些微服务治理的实现, 往往是以代码库的形式把这些服务治理的逻辑构建在应用程序自身中,这些代码库中包含了流量治理、熔断、重试、客户端负载平衡、平安以及可观测性等这样的一些性能。这些代码库随着性能的一直加强, 版本也随之变更,因为版本不同导致的抵触问题处处可见。此外,库的版本一旦变更,即便你的应用逻辑并没有任何变动,整个利用也要随之全副变更。由此可见, 随着利用的增长和团队数量的减少,跨服务统一地应用这些服务治理性能会变得非常复杂。

服务治理的能力 Sidecar 化

通过把这些服务治理的能力 Sidecar 化,就可能把服务治理的能力与应用程序自身进行理解耦,能够较好地反对多种编程语言、同时这些 Sidecar 能力不须要依赖于某种特定技术框架。这就是咱们常说的面向 Sidecar proxy 的架构模式。

随着这些 Sidecar 代理性能的加强,本来须要在代码库中实现的服务治理性能被抽象化为一个个通用组件, 并被逐步地下沉到代理中。这些服务治理能力的标准化、统一化,能够解决简单零碎微服务实现中面临的差别大、短少共性的问题,能够很好地反对不同的编程语言、不同的框架。

通过把应用服务通信能力形象下沉到基础设施,   使得开发人员能够更加聚焦于业务利用自身开发,  而让基础设施来提供这些通用的能力。

与此同时,容器编排技术的更加成熟,也减速了 Sidecar 代理的遍及与应用的便捷。Kubernetes 作为一个杰出的容器部署和治理平台、Istio 作为应用服务治理的平台,两者的联合成为了将这些应用服务通信能力下沉到基础设施的载体。

在云原生利用模型中,一个应用程序可能会蕴含数百个服务,每个服务又有数百个实例形成,那么这些成千盈百个应用程序的 Sidecar 代理如何对立治理,这就是服务网格中定义的管制立体局部要解决的问题。作为代理,Envoy 非常适合服务网格的场景,但要施展 Envoy 的最大价值,就须要使它很好地与底层基础设施或组件紧密配合。

这些 Sidecar 代理造成一个网状的数据立体,通过该数据立体解决和察看所有服务间的流量。数据立体表演了一个用来建设、爱护和管制通过网格的流量的角色。

负责数据立体如何执行的治理组件称为管制立体。管制立体是服务网格的大脑,并为网格应用人员提供公开 API,以便较容易地操纵网络行为。

启用服务网格之后,  开发人员、运维人员以及 SRE 团队将以对立的、申明的形式解决应用服务治理问题。


 

服务网格 ASM 产品架构

作为业内首个全托管 Istio 兼容的服务网格产品 ASM,一开始从架构上就放弃了与社区、业界趋势的一致性,管制立体的组件托管在阿里云侧,与数据面侧的用户集群独立。ASM 产品是基于社区开源的 Istio 定制实现的,在托管的管制面侧提供了用于撑持精细化的流量治理和平安治理的组件能力。通过托管模式,解耦了 Istio 组件与所治理的 K8s 集群的生命周期治理,使得架构更加灵便,晋升了零碎的可伸缩性。

  • 在深入分析服务网格方面,提供了网格诊断能力,把过来一年多来客户遇到的问题以及如何解决这些问题的伎俩变成产品能力, 帮忙用户疾速定位遇到的问题;
  • 在扩大与集成方面,ASM 产品整合阿里云服务包含可观测性服务链路追踪 / 日志服务 /Prometheus 监控等、跨 VPC 网络互连 CEN 能力等,同时也优化整合了社区开源软件包含 OPA 的反对、受权服务的定制化能力、限流服务等。

此外,随着 Istio 新架构的优化,将 WebAssembly 技术引入服务网格,解决代理扩大的问题。这样一来,  ASM 架构就变成了“托管的高可用弹性控制立体 + 可扩大的插件式的数据立体“的模式。

在数据立体的反对上,ASM 产品能够反对多种不同的计算基础设施,这包含了阿里云提供的私有云 ACK 集群(其中包含了托管的 K8s 集群和专有 K8s 集群)、也包含对的无服务器 Kubernetes 容器服务 ASK 集群的反对。同时, 对非容器化利用例如运行在 ECS 虚拟机上的应用服务网格化的反对。

此外,ASM 也推出了一个反对多云混合云的能力,可能针对内部的非阿里云 K8s 集群进行反对,不管这个集群是在用户自建的 IDC 机房,还是在其余的私有云之上,都能够通过 ASM 进行对立的服务治理。

多种类型计算服务对立治理的基础设施

接下来,  将会介绍托管式服务网格在成为多种类型计算服务对立治理的基础设施中, 如何提供了对立的流量治理能力、对立的服务平安能力、对立的服务可观测性能力、以及如何基于 WebAssembly 实现对立的数据面可扩大能力。

1. 对立的流量治理能力

对于对立的流量治理能力方面, 重点讲述 2 个方面。

第一个是基于地位实现流量路由申请。在大规模服务场景下, 成千上万个服务运行在不同地区的多种类型计算设施上, 这些服务须要互相调用来实现残缺的性能。为了确保获得最佳性能,该当将流量路由到最近的服务,使得流量尽可能在同一个区域内,而不是只依赖于 Kubernetes 默认提供的轮询形式进行负载平衡。服务网格该当提供这样的基于地位的路由能力,一方面, 能够将流量路由到最靠近的容器, 实现本地优先的负载平衡能力, 并在主服务呈现故障时能够切换到备用服务。另一方面, 提供部分加权的负载平衡能力, 可能依据理论须要, 将流量按比例拆分到不同的地区。

第二个是对于非 K8s 工作负载的网格化对立治理。在一个托管的服务网格实例中, 咱们能够增加若干个 K8s 集群, 并在管制面定义路由规定的配置, 也能够定义网关服务等。为了可能对立地治理非 K8s 工作负载, 咱们通过一个 WorkloadEntry 的 CRD 来定义工作负载的标签以及该工作负载运行的 IP 地址等信息。而后通过 ServiceEntry CRD 将这个工作负载注册到服务网格中, 并提供相似于 K8s Pod 的解决机制来解决这些非 K8s 工作负载。譬如能够通过 selector 机制路由到对应的 Pod 或者这个非容器利用上。

2. 对立的服务平安能力

对于对立的服务平安能力, 托管服务网格为多种不同计算基础设施上的应用服务提供对立的奴才账户反对 / RAM 受权反对。在此基础上, 提供对立的 TLS 认证与 JWT 认证,  反对启用与禁用 TLS 认证的繁难切换、反对以渐进形式逐渐实现双向 TLS 认证; 反对以细粒度的认证范畴, 包含 namespace 与 workload 级别。此外, 服务网格也提供对 JWT 认证能力的反对, 使得这种 TOKEN 认证机制不再依赖于某种特定实现框架就能够对立透出。

  • 在 RBAC 受权方面, 针对不同协定提供了对立的受权策略, 能够在不同粒度上反对, 包含 namespace / service / port 级别的受权;
  • 在审计方面, 能够灵便开启网格审计性能, 并能够查看审计报表、查看日志记录以及设置告警规定等;
  • 在策略管理方面,提供了凋谢策略代理(OPA)的集成, 用户能够应用描述性策略语言定义相应的安全策略。此外也提供了自定义受权服务 external_auth grpc 的对接。只有遵循这一接口定义, 任意受权服务都能够集成到服务网格中。

3. 对立的服务可观测性

对立的服务可观测性, 分为 3 个方面。

  • 一是日志剖析能力:通过对数据立体的 AccessLog 采集剖析, 特地是对入口网关日志的剖析, 能够剖析出服务申请的流量状况、状态码比例等, 从而能够进一步优化这些服务间的调用;
  • 二是分布式追踪能力:为分布式应用的开发者提供了残缺的调用链路还原、调用申请量统计、链路拓扑、利用依赖剖析等工具,能够帮忙开发者疾速剖析和诊断分布式应用架构下的性能瓶颈,进步微服务时代下的开发诊断效率;
  • 三是监控能力:依据监督的四个维度(提早,流量,谬误和饱和度)生成一组服务指标, 来理解、监督网格中服务的行为。

4. 对立的数据面可扩大能力

只管 sidecar 代理曾经把服务治理过程中罕用的一些性能进行了封装实现,但它的可扩大能力肯定是必须具备的,譬如如何与已有的后端系统做对接,如何解决用户的一些特定需要。这个时候,一个 Sidecar 代理的可扩展性显得尤为重要,而且在肯定水平上会影响 Sidecar 代理的遍及。

在 Istio 之前的架构中,对 Sidecar 能力的扩大次要集中在 Mixer 组件上。Sidecar 代理的每个服务到服务连贯都须要连贯到 Mixer,以进行指标报告和受权查看,这样会导致服务之间的调用提早更长,伸缩性也变差。同时,Envoy 要求应用代理程序的编程语言 C++ 编写,而后编译为代理二进制文件。对于大多 Istio 用户而言,这种扩大能力具备肯定的挑战性。

而在采纳了新架构之后,Istio 把代理的扩大能力从 Mixer 下移到了数据立体的 Envoy 自身中, 并且应用 WebAssembly 技术将其扩大模型与 Envoy 进行了合并。WebAssembly 反对几种不同语言的开发,而后将扩大编译为可移植字节码格局。这种扩大形式既简化了向 Istio 增加自定义性能的过程,又通过将决策过程转移到代理中而不是将其种植到 Mixer 上来缩小了提早。应用 WebAssembly(WASM)实现过滤器 Filter 的扩大, 能够取得以下益处:

  • 敏捷性:过滤器 Filter 能够动静加载到正在运行的 Envoy 过程中,而无需进行或从新编译;
  • 可维护性:不用更改 Envoy 本身根底代码库即可扩大其性能;
  • 多样性:能够将风行的编程语言(例如 C / C ++ 和 Rust)编译为 WASM,因而开发人员能够应用他们抉择的编程语言来实现过滤器 Filter;
  • 可靠性和隔离性:过滤器 Filter 会被部署到 VM 沙箱中,因而与 Envoy 过程自身是隔离的;即便当 WASM Filter 呈现问题导致解体时,它也不会影响 Envoy 过程;
  • 安全性:过滤器 Filter 通过预约义 API 与 Envoy 代理进行通信,因而它们能够拜访并只能批改无限数量的连贯或申请属性。

阿里云服务网格 ASM 产品中提供了对 WebAssembly(WASM)技术的反对,服务网格应用人员能够把扩大的 WASM Filter 通过 ASM 部署到数据面集群中相应的 Envoy 代理中。通过自研的 ASMFilterDeployment 组件,  能够反对动静加载插件、简略易用、以及反对热更新等能力。

通过这种过滤器扩大机制,能够轻松扩大 Envoy 的性能并将其在服务网格中的利用推向了新的高度。

服务网格实际之成熟度模型

服务网格作为应用服务通信的对立基础设施,  能够(并且应该)逐渐采纳。在此, 咱们推出了它的实际之成熟度模型, 分为了 5 个档次, 别离为 一键启用 可观测晋升 平安加固 多种基础设施的反对 , 以及 多集群混合治理。这 5 个方面别离涵盖了后面讲述的对立流量治理、对立可观测性、对立服务平安以及反对不同的计算基础设施和多集群非容器化利用的混合治理。

《Istio 服务网格技术解析与实战》读者可收费体验 ASM 产品进行学习!点击理解阿里云服务网格产品 ASM:www.aliyun.com/product/servicemesh

作者简介

王夕宁 阿里云高级技术专家,阿里云服务网格产品 ASM 及 Istio on ACK 技术负责人,关注 Kubernetes、云原生、服务网格等畛域。之前曾在 IBM 中国开发核心工作,曾负责专利技术评审委员会主席,作为架构师和次要开发人员负责参加了一系列在 SOA 中间件、云计算等畛域的工作,领有 50 多项相干畛域的国内技术专利。著有《Istio 服务网格技术解析与实际》。xining.wxn@alibaba-inc.com

8 月 14 日 11:00 前在阿里巴巴云原生公众号留言区 欢送大家探讨交换对服务网格技术 Istio 的纳闷,精选留言点赞前 3 名各送出《Istio 服务网格技术解析与实际》图书一本!

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术畛域、聚焦云原生风行技术趋势、云原生大规模的落地实际,做最懂云原生开发者的公众号。”

正文完
 0