关于运维:阿里云-FaaS-架构设计

简介：本篇内容将从 2 个局部为读者介绍对于阿里云 FaaS 架构设计和神龙高密部署的 FaaS，心愿能够让大家对阿里云 FaaS 有更深刻的理解，并能够将 FaaS 利用到我的项目中，达到降本提效的目标。

一、基于 ECS 的 FaaS

在阿里云传统架构，用户通过互联网进入到负载平衡零碎中，再通过负载平衡把零碎的申请调度到不同的机器下来。这种传统的架构带来的问题比拟多，一方面是多利用配比比例容易失衡，造成资源节约；另一方面是镜像降级比拟繁琐，整个过程的开机速度在分钟级，扩容速度也绝对较慢。

(1) 架构设计

基于 ECS 的 FaaS 架构设计同样也是通过互联网进入，落到 SLB 负载平衡上。SLB 负载平衡这个零碎是部署在阿里云外部的，次要用于抵御 DDoS 攻打及申请平衡到多台 api_server 上。api_server 再发动函数的 CRUD 操作，并向 Scheduler 申请容器。

Scheduler 治理容器在 worker 的搁置，申请落在容器上的调度散发。用户所在 worker 就是咱们称之为的计算节点，如果须要拜访用户的 VPC 环境则在计算节点上通过 ENI 网卡买通到用户 VPC 环境。

(2) 多租户多利用部署的反对

namespace 是 linux 前几年推出的一个资源隔离计划，能够在内核层面做一些设置指定一部分过程固定。并且能够在 cgroup 的这一套设置计划里设置，管制资源的拜访。在 namespace、cgroup 整套计划下，衍生出了 container，社区中罕用的的 Docker 计划把镜像操作系统中的很多细节包装成一个计划，用户看到了一个绝对比拟残缺的操作系统，把用户当成一个单个用户搁置在虚拟机当中。这就是一个 vm，相当于说一台 ECS，这里就是操作系统层面，把整个 cpu、memory、包含设施全副给屏蔽掉，在下面用 cgroup 封一层，对应的就是 Docker 容器。

利用搁置策略包含用户独占虚拟机、同 VPC 独占虚拟机、资源拜访权限统一的 APP 混部在同机器。把两个不同的用户混在一个 vm 下，也就是 ECS 下面，对于用户之间来说是存在危险的。为了屏蔽掉共用 kernel 带来的危险，ECS 上的实现，咱们单个 ECS 只有一个租户，这样解决也存在一些问题，最突出的就是对于低频调用函数资源使用率低。

(3) 疾速程度弹性扩容

如何做到程度弹性扩容？

① 通过利用容器部署，能够定制一些特地的语言、Runtime容器、通用LIB/SDK，并放弃社区生态统一，这样就不须要另外去下载，用户用起来也比拟不便，启动速度也十分快。

② 通过设置公共容器镜像、容器镜像写入ECS镜像、ECS镜像启动机器、疾速补充机器池等管制机器资源池，从而可能兼顾性能与老本。

③ 在池化的机器中池化容器创立、代码目录提早挂载、提前启动runtime、提前health check，用户申请降临的时候须要启动的工夫会变得更短。

④ 通过限度用户利用大小、激励拆分业务逻辑、内置SDK/Lib来管制利用大小。

⑤ 通过P2P镜像散发、防止对下载服务造成冲击、按需加载、升高下载提早、晋升启动速度等实现P2P镜像下载减速。

如何晋升资源使用率

在理论研发过程中发现，雷同QPS下单位工夫片内调度对资源量的影响十分大，咱们能够通过调度晋升资源使用率。例如在下图中，咱们看到宏观状态下的整体 TPS 是十分稳固的，然而事实上，咱们放大到毫秒级别会发现，其实十分不平均！那么这种不平均到底会给咱们带来什么影响？

假如咱们每个容器被设置的最大并发度为 1，即任意时刻一个容器只解决一个工作。下图展现了 a,b,c,d,e,f 多个申请在不同时刻点被调度时对容器数目的影响。

能够看到场景一时，每个申请平均打入时，任意时刻只须要一个容器就够了，这种状况就是咱们现实中心愿能达到的；

而在场景二下，如果调度产生了滞后，可能导致前置的申请和起初的申请混到了一个工夫点，导致容器数目翻倍，在两头的空白处，这些容器又没有被充分利用造成了资源的节约；

在场景三下，如果容器启动耗时较长，或者调用耗时变长，原来的 b 申请会和 a 申请呈现工夫上的叠加，导致又须要创立新的容器，而新的容器如果须要较长时间的冷启动，又会导致和 c 申请呈现工夫上的叠加。如果调度零碎实现得不够好，这样一来就可能产生雪崩效应，导致资源使用量暴涨，而理论使用率却极其低下。

通过下面几个场景，咱们能够大抵为资源使用率的开销上总结一个优化方向：

尽可能让调度更平均、更正当，防止扎堆唤起容器
尽可能升高冷启动时长，防止短期大量容器都处于创立当中，防止无意义的系统调度开销
除了上述外，咱们还能够思考高密部署，将单机的资源使用率晋升下来

如何容灾、避免雪崩？

在实际操作中产生异样的时候，用户申请会出错，出错后会重启或调动新资源创立新的容器，但这样会导致整个提早增大。用户有又会反复尝试，反复尝试则会导致负载升高，从而又引起异样，如此恶性循环。能够通过优化启动速度、多 Partition 容灾部署、指数退却重试、Breaker 阻断异样申请、多可用区备灾、SLB 阻断 DDoS 攻打来避免雪崩。

二、基于神龙高密部署的FaaS

(1) 为什么须要做高密部署？

一是因为弹性启动速度要求高，心愿做到每秒1万个容器实例的启动、启动提早管制在300毫秒以内、容器的存活工夫在分钟级别、资源粒度128MB；

二是老本更低，ECS 架构因平安隔离问题资源碎片多，突发调用提早高，影响资源数目；

三是性能，ECS 单机缓存少、申请毛刺率较高、申请最大提早高；

四是稳定性，高并发对系统冲击、频繁的创立删除资源、ECS管控压力，爆炸半径难以管制。

(2) 高密部署架构带来的技术难题

整个高密部署架构带来的一些技术难题：

首先要面对的是如何解决单机多租户隔离平安危险，如果不解决这个问题那么就无奈做到单机多租户的平安高密部署，这样资源使用率密度无奈无效晋升；

其次是如何解决高并发下启动速度问题，如果无奈做到这点，如咱们后面所提到的，冷启动工夫较长会重大加剧资源的开销，同时重大影响用户提早体验；

再就是如何解决单机多租户VPC网络买通及平安问题，这一点其实十分重要，咱们在 ECS 上建设 VPC 网络连接的速度十分慢，这也重大影响了用户冷启动及资源的应用；

另外咱们还须要思考如何设计高密部署下的技术容灾计划，因为任何一个计算节点的异样会带来大量用户的服务异样。

(3) 基于平安容器模板技术的优化

咱们是如何做到基于平安容器模板技术的优化的？每个容器独占一个虚拟机沙箱，这个沙箱相当于是一个独立的虚拟机，有本人独立的 linux 内核，这样一来每个容器都是通过独立的 kernel 来做平安隔离。神龙启动时模板化大量虚拟机用于晋升启动速度，通过 virtiofs 提早挂载用户代码目录，通过虚拟机微内核隔离用户，能够做到单台机上每个微内核20M左右的内存，单机至多 2000 个容器，管制它的冷启动工夫是在250毫秒左右。通过调度算法，咱们能够正当地应用资源，承诺用户的资源 quota。

(4) 代码按需加载

代码按需加载是通过以下几个方面做到的：用户容器会重复使用同一份代码，单台神龙只需下载一次；脚本语言蕴含了大量用不到的代码；应用应用 FUSE（用户空间文件系统）来做中间层文件的实在读取；底层应用 NAS 做低提早的数据下载；OSS（阿里云对象存储）做高带宽反对的数据下载。留神到，咱们这里混用了 NAS 及 OSS 一起来做代码的加载，须要留神的是，NAS 的拜访提早相对而言更低，对于小文件的加载更快。咱们在加载初始阶段开始全量异步从 OSS 下载代码。而对于须要立刻拜访的数据，咱们则从 NAS 上读取。因为咱们将整个用户代码目录做成了两个文件：一个为目录文件索引数据，另一个为文件内容数据。因为 NAS 拜访提早低，咱们能够通过相似 GetRange 的形式去数据文件上获取小文件内容。这样就能够用最快的速度即时加载用户代码来达到疾速冷启动了。

![上传中…]()

(5) VPC 网络优化

基于网络服务网格的 VPC 网关代理是通过用户VPC网络安全隔离。咱们过来在 ECS 计划上插拔 ENI 网卡十分耗时，至多须要2~3s，P99甚至达到6～8s。在高密部署的神龙计划上，咱们没有必要为每个平安容器做屡次网卡插拔，只须要在神龙机器上对立买通到网关代理，而用户 ENI 网卡常驻在网关集群上，这样整个网卡的加载速度会变得很快。这样对于用户体验和资源开销都会是一个微小的优化。

(6) 资源分配率

通过混合部署多租户各类业务晋升部署密度，正当配比不同资源需要的容器到一台物理神龙，从而晋升资源分配率。

三、总结

讲师简介：朱鹏，阿里云 Serverless 技术专家，负责阿里云函数计算调度设计研发，在函数计算高并发、技术容灾、冷启动优化、调度资源管理、神龙裸金属技术架构等多个方向均参加了设计和研发实现，是阿里云函数计算神龙高密部署架构主导推动负责人之一。目前次要致力于晋升资源使用率，钻研设计超大规模并发下的低提早资源调度解决方案。

原文链接
本文为阿里云原创内容，未经容许不得转载。

关于运维:阿里云-FaaS-架构设计

一、基于 ECS 的 FaaS

(1) 架构设计

(2) 多租户多利用部署的反对

(3) 疾速程度弹性扩容

二、基于神龙高密部署的FaaS

(1) 为什么须要做高密部署？

(2) 高密部署架构带来的技术难题

(3) 基于平安容器模板技术的优化

(4) 代码按需加载

(5) VPC 网络优化

(6) 资源分配率

三、总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于运维:阿里云-FaaS-架构设计

一、基于 ECS 的 FaaS

(1) 架构设计

(2) 多租户多利用部署的反对

(3) 疾速程度弹性扩容

二、基于神龙高密部署的FaaS

(1) 为什么须要做高密部署？

(2) 高密部署架构带来的技术难题

(3) 基于平安容器模板技术的优化

(4) 代码按需加载

(5) VPC 网络优化

(6) 资源分配率

三、总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复