关于数据库:走进RDS｜说说关系型数据库与Serverless

简介：看到现在Serverless在云计算行业喷薄欲出的态势，像极了《星星之火，能够燎原》中的形容：尽管不能预测将来的倒退和变动，但对于云计算来说这是个绝对确定的方向。本文将和大家说说关系型数据库与Serverless。

作者 | 韦仁忠
起源 | 阿里开发者公众号

对于Serverless

看到现在Serverless在云计算行业喷薄欲出的态势，像极了《星星之火，能够燎原》中的形容：尽管不能预测将来的倒退和变动，但对于云计算来说这是个绝对确定的方向。

从Google Trends的Serverless关键字的趋势能够看到，对于Serverless的搜素始终居高不下，并且在将来的一段时间内也会放弃相当的热度。从2015年开始，以AWS为代表的国外云计算大厂也在一直的布局Serverless相干的产品，AWS Lambda、Aliyun FAAS，数据库畛域的Aurora Serverless、RedShift Serverless、Azure SQL Database等。

学术界对Serverless的钻研热度也不亚于工业界对商业化计划的谋求，文末列出了一些相干文章作为参考。对于云计算往Serverless演进的趋势，学术界也经验过一些质疑，2018年“Serverless Computing: One Step Forward, Two Steps Back”[3] 文章已经对Serverless的倒退给当初IT基础设施带来的冲击示意过担心，但2019年同一拨人在这个方向上又体现出了反对和乐观的态度。从Serverless畛域被援用次数较多的论文上看到，支流科研机构对Serverless的趋势和方向钻研上趋于统一，钻研重点也缓缓从“why”转变为“how”[6]。

何为Serverless？为什么Severless是个趋势？“Cloud Programming Simplified: A Berkeley View on Serverless Computing”[5] 这篇文章为代表做了一个比拟全面的剖析和预测。同样是Berkeley在2009年发表的另一篇文章“Above the Clouds: A Berkeley View of Cloud Computing”[7] 预测了云计算作为IAAS基础设施的观点。该篇文章连续了之前的格调，剖析了现状和难点，预测了云计算2.0的状态Serverless作为下一代基础设施，也定义了Serverless的次要三个特色：

资源的解耦和服务化：弱化了存储和计算之间的分割。服务的贮存和计算被离开部署和免费，存储不再是服务自身的一部分，而是演变成了独立的云服务。这使得计算变得无状态化，更容易调度和扩缩容，同时也升高了数据失落的危险。
主动弹性伸缩：代码的执行不再须要手动分配资源。不须要为服务的运行指定须要的资源（比方应用几台机器、多大的带宽、多大的磁盘等），只须要提供一份代码，剩下的交由 Serverless 平台去解决就行了。以后阶段的实现平台分配资源时还须要用户方提供一些策略，例如单个实例的规格和最大并发数，单实例的最大 CPU 使用率。现实的状况是通过某些机器学习算法来进行齐全主动的自适应调配。
按使用量计费：Serverless依照服务的使用量（调用次数、时长等）计费，而不是像传统的 Serverful 服务那样，依照应用的资源（ECS 实例、VM 的规格等）计费。

值得一提的是[5]这篇文章有泛滥云计算厂商的背书，包含AWS、Micorsoft、Google、Alibaba等，同时文章也间接以AWS Lambda服务作为样板去剖析Serverless的问题。Serverless自身的技术难度，这篇文章列举了多项内容，这里不做赘述，能够具体读一下文章。

对于Serverless的技术实现[3]给出了一个可行的零碎实现形式，当然还是以FAAS为背景。其中提到Serverless关键技术门路包含：

对立的规范运行环境反对多语言的运行时对立治理
轻量级/蝇量级平安容器（在[4]中额定提到平安和隔离的重要性）
冷热容器池设计做极致的多租户复用能力
高效的函数调度能力

其中，函数计算的实现形式，却与数据库Serverless非亲非故。

数据库的Serverless

数据库品类繁多，关系型数据库自1979年E. F. Codd对于关系模型的形容[7]开始，后来者大多只是模拟，而尚未在用户接受度和规模上有超过。

数据库不仅仅是一个“stateful”的利用，而且是一个“state-heavy”的利用。数据库是Serverless最不敌对的利用之一，包含云原生基础设施kubernates对于stateful利用的反对，也是等到StatefulSet和operator之后才有一个比拟好的解决方案。而在这之前数据库都是作为Serverless对状态做解耦和状态下沉的工具，也是全栈Serverless解决方案中最难攻坚的最初一个堡垒。

对于Serverless的定义，文章给进去一个公式：Serverless = FAAS+ BAAS。将FAAS（Functions as a Service）定义为事件、API、音讯驱动的计算层；将BAAS（Backends as a Service ）定义为相似数据库、音讯队列等后端服务。

“State-heavy applications will remain as BaaS”是目前对于数据库的一个根本认知，但这与数据库自身是否具备肯定水平的Serveless能力其实是两回事。前者强调的是在利用向Serverless做架构转型的过程当中，数据库的大量状态存储做不到FAAS这样即开即用的能力，只能作为“+”来对接Serverless生态；后者说的是在某种程度上也可能满足“资源解耦”、“主动弹性”、“按使用量付费”的特点，某种程度上也能够认为是Serverless。

数据库Serverless的难点到底在哪里？

数据库做Serverless有若干难点[4]，总结如下：

Serverless没有内置的长久化存储，须要依赖远端存储，这就会导致在延时上较高；
客户端是基于连贯的形式拜访数据库，在客户端往往会保护连接池的形式供给用拜访，而函数计算往往具备飘忽不定的网络地址，与数据库传统的IP+User+password鉴权的形式迥异；
很多高性能的数据库应用共享内存技术，而FAAS自身不具备共享内存的能力，会使得计算和数据库之前的资源动静扩大能力不统一

其中尤其要留神的是第2点，在利用进FAAS之后，以后的数据库拜访形式曾经不适用于Serverless生态：

服务器与DB做连贯放弃，这就意味着拜访状态是由客户端和数据库独特保护，而FAAS无奈做到连贯持续保持的能力；
服务器通过driver和连接池的形式拜访数据库，每次的连贯初始化绝对较重，FAAS上无奈接受如此重的连贯初始化工作；
服务器拜访鉴权通过user/password/ip的形式拜访数据库，而FAAS多租户场景所有用户共享IP地址池，user/password内置到FAAS当中也裸露了极大的平安危险；

数据库须要一种新的拜访形式，间接影响到数据库是否作为Serverless生态当中的一部分，间接影响到以后Serverless利用做全栈Serverless革新。其重要水平甚至大于数据库Serverless（资源解耦、极致弹性、按使用量付费等）自身。

当然数据库自身要做的事件远远不止如此，数据库自身要实现高效的弹升弹降，波及到更多的管控和内核严密的联动。

他山之石

行业翘楚AWS在Serverless相干的布局从2015年推出Lambda开始，引领着这个方向的倒退。这里更多的关注在数据库方面，联合AWS在Aurora Serverless上的取舍，洞察AWS对于数据库Serverless的了解。

从Aurora Serverless V1发表于2018年，在Serverless的理念上做了大胆的翻新，做了几件事件：

以ACU的形式去对立底层的资源，不再对下层裸露底层具体的机型和代数。1ACU“相当于”2GiB的RAM，对立对底层资源做了标准化和规范化的解决。这与Serverless理念中资源的解耦、以及对底层资源的屏蔽统一；
反对主动启停，在无负载的状况下反对将计算节点升高至“0”。将Serverless中按资源使用量付费体现到极致，但也带来了另外的问题。主动启停在个别场景下首次拉起须要30s左右，就义了局部auto scale的能力；
数据库弹性过程中内核相干buffer pool等参数随着资源配合的变动而发生变化，这也是数据库这种非凡的利用场景须要做的一些非凡解决；
2019年推出Data API性能，补全了数据库作为BAAS接入FAAS的能力，解决了后面提到的生态兼容的问题。

2020年公布的Aurora Serverless V2的介绍视频并提供内测申请，而在前不久V2也正式GA。从Aurora Serverless V2的能力来看，在Serverless能力上做了加强和取舍：

将V1中弹性能力持续晋升至秒级，做极致疾速的弹性。将V1中跨机降级的能力优化为本地降级的能力，保障业务在弹性过程中不受损。从Aurora Serverless只在3.0.2这一个版本上反对能够看出，内核层针对Serverless场景也做了大量的优化；
去除了V1中对于主动启停的能力，用户能够手动启停实例；更加关注实例的auto scale能力，最小资源升高至0.5ACU而非0，就义了局部按使用量付费的能力，这也是一种取舍；
将弹性缩容的策略做得更加激进，以保障业务压力状况下对业务的影响尽可能小。

从V1到V2的变动，比照V2和V1的User Case能够看出，Aurora Serverless V2次要解决的是从“开发测试环境”到无限场景下的生产环境的转变，至于底层的实现原理，能够从一丝丝蛛丝马迹中去探索。联合其余云的做法，Serverless的能力目前还是看重这个理念，各个厂商也在以本人的产品状态去向贴近这个理念，至于说一统行业标准的产品化计划，还为时过早，这一畛域大有可为。

将来可期

从2009年开始，云的能力一直加强，云的实质是资源的池化，而这些资源不仅仅蕴含硬件资源，更蕴含业余的技术人才、以及外围的技术专利规范等。通过了十来年在规模和老本上的强烈竞争，IAAS资源也在一直的向Serverless的方向演进，以阿里云自身为例，包含弹性的存储AutoPL、弹性的容器ECI、Serverless服务引擎SAE。底层能力的加强也意味着下层PAAS层和SAAS服务有了更快的向Serverless演进的门路，阿里云数据库就是其中受害的一方PAAS。

如果开源托管产品RDS能够看成是云数据库服务1.0，自研产品如PolarDB和Aurora能够看成是云数据库2.0，那么Serverless将会是云数据库服务的3.0。其中，客户利用跟数据库交互方式的扭转（例如，从JDBC/ODBC向Restful API转变），将会具备重要意义。

从艾瑞2022年初对数据库云管平台的发展趋势预测[9]、以及联合云的趋势和Serverless自身，咱们能够对Aurora Severless将来的倒退方向做一些大胆的预测：

智能化加持：从re:Invent2021公布的Devops Guru产品上看到，AWS正在智能化场景下进行追赶。内置的智能化引擎对Serverless的场景能够做出更多的精准预测，让“响应式”扩容降级为“响应式兜底，智能化加持”的双引擎驱动；
资源解耦和极致的弹性：共享内存技术、Brust IO能力等会推着Serverless将更多的资源进行解耦，以及进行独立的升降配；
更多的Serverless伎俩：扩容是最无效间接应答数据库流量的形式，然而有了更多智能化的伎俩之后，单纯的“扩容”曾经有更多抉择，主动索引优化、智能调参会是很好的选项；
主动的横向扩大能力：scale out和scale up同样能够应答业务流量的变动，但scale out的复杂程度要远远高于scale out自身，也是个可能的选项；
低成本硬件大规模应用：ACU的单位定义屏蔽了底层资源属性，ARM、x86还是RISC-V曾经不是那么重要，标准化归一化的算力能力让更多类型的硬件无缝无感的接入到Serverless当中。

阿里云 RDS MySQL 也在2022年4月份推出了Serverless版本，咱们将在后续的文章中做重点的介绍，咱们会以一个规范的网站利用（前端页面+API服务器+数据库）为样板，介绍如何在FAAS+BAAS的架构下一步步做全栈Serverless的革新，真正做到“0”服务器。

作者介绍：

韦仁忠，以后次要负责RDS MySQL管控产品建设，欢送有志之士加盟RDS产品部，邮箱：renzhong.weirenzho@alibaba-in...

参考文献

2016: "Emerging Technology Analysis: Serverless Computing and Function Platform as a Service", Gartner, Tech.
2017: "Serverless Computing: Current Trends and Open Problems", IBM Research
2017: "Serverless Computing:Design, Implementation, and Performance"，IEEE 2017 ICDCSW
2018: "Serverless Computing: One Step Forward, Two Steps Back ", CIDR 2019
2019: "Cloud Programming Simplified: A Berkeley View on Serverless Computing", EECS 2019
2020: "Serverless Applications: Why, When, and How?", IEEE Software
2009: "Above the Clouds: A Berkeley View of Cloud Computing"， EECS 2009
1970: "A relational model of data for large shared data banks", Commun. ACM 1970
2022: https://www.iresearch.com.cn/... 艾瑞征询

原文链接
本文为阿里云原创内容，未经容许不得转载。