关于阿里云:专访涯海阿里云中间件是如何支撑双11的

76次阅读

共计 6648 个字符,预计需要花费 17 分钟才能阅读完成。

** 以下是本次访谈要害内容的整顿。
点击这里可返回“2020 阿里双 11 技术全观”专题查看访谈视频回放

播报员:

各位开发者敌人们,大家好。欢送收看咱们这一期的双 11 技术播报栏目,我是你们的播报员莫孤。明天咱们仍然还是双 11 技术播报的特别篇,特地邀请了阿里云中间件团队的涯海来加入咱们这一期的双 11 技术播报栏目,他是这一次中间件团队的大队长,率领着中间件团队加入了双 11 的整个我的项目,在此过程中必定有十分多好玩的事件,也会有十分多的技术冲破给咱们分享。那就让咱们来热烈欢迎一下涯海来到咱们的直播间。

涯海:谢谢莫孤。

播报员:
要不你先跟大家介绍一下本人?

涯海:
我是来自 阿里云智能的中间件团队队长涯海。我是一个新人,其实我感觉本人比拟新,首先这是我往年第一年当中间件的队长,而后我也是一个毕业不到 5 年的应届生,所以我认为本人的心态还是比拟新的。另外我平时比拟喜爱打游戏,应该跟大多数男生是差不多的,并且我玩魔兽世界曾经十几年了,能够认为是骨灰级的一个玩家,当然是两头 AFK 过很屡次,比方往年做大促就长期的又 AFK 了。那正好往年做完(大促)之后,我就筹备把我的电脑修一修,再次回到我的艾泽拉斯大陆。我就介绍这么多。

播报员:
好的,刚刚说到电脑的问题,其实咱们采访的另外一位大队长智盛,据说他对这一块特地理解,我感觉你们能够接下来去深度的聊一下电脑怎么修复的事件。往年是涯海正式退出阿里的第 5 年,然而曾经作为大队长率领中间件团队去加入整个双 11 的我的项目了,十分的年轻有为。

我想问一下你第一次当大队长是一种什么样的体验呢?

涯海:
首先第一个就是感觉比拟刺激,对,因为作为一个 BU 的大促队长,其实上面(代领)的同学有很多,第一次享受到了呼风唤雨的感觉,当然这是开玩笑的。

其实刺激的背地就是感觉到挑战十分的大,因为中间件的产品十分多,咱们有 20 多款产品,而后外围备战的同学有六七十位,怎么去进行外部的协调,怎么进行这么多产品的协同,而后对外去提供对立的服务,并且咱们团体有 40 多个 BU 都在用咱们中间件的服务,怎么去保障最终大促的稳定性,这是一个十分具备挑战和刺激的一个事,这是第一个感触。

 第二个就是感触就是大促是一个超级工程,它是非常复杂并且精细的,从整个 CTO 到 5 位团体的大队长,到咱们 40 多个 BU 的队长,而后层层再到上面的同学,每一层级都是十分紧密、谨严,而后每个人的边界又很清晰,然而补位的意识要十分的强,大家既是齿轮,又是一个连贯的枢纽。在这个过程中我就是十分侥幸的可能从更下层的视角去看到整个团体的从业务到最底层的一些物理设施,比如说网络供应链这类,这个是之前做研发十分不一样的体感,这是第二点感觉。

第三点的话就是做大促其实是痛并高兴着。苦楚是必定有的,因为做大促十分的辛苦,而且往年双 11 也十分的长,并且任何一个小的危险点都不能脱漏,因为千里之堤溃于蚁穴,所以咱们的工作必须做的十分粗疏,然而高兴也是前所未有的,有点像什么?比如说咱们打篮球,一场可能得了很多球很多分,十分高兴,然而相对来说就没有踢足球的高兴更大,有可能你踢一场下来只能进一个球,就是说一个漫长的致力,最终会到一个微小的回报,以及十分大的满足感。这个是我集体的一些感触。

播报员:
对,我感觉你刚刚形容的特地地活泼形象,用踢足球和打篮球来形容一下加入双 11 的体感,让我十分的感同身受。

刚刚也有提到说作为队长去率领咱们的整个中间件团队加入双 11 的我的项目的话,能够从业务上有一个更全面地理解。我想问一下中间件往年是怎么撑持双 11 的,达到了怎么样的业务后果呢?

涯海:
首先咱们会先依据往年业务的指标来确定咱们整体的一些打法,比如说往年咱们业务的峰值是什么样的,除了峰值之外,会不会有其余的一些外围指标,而后咱们会把最重要的指标拆解到中间件的每一个产品,同时联合咱们本身的一些产品的技术架构的演进,来提前的去储备咱们的技术的力量,这是第一步:确定指标。

第二步就是咱们要具体确定咱们的外围备战人员,就是有哪些同学,其中老同学有多少,新同学有多少,怎么使得咱们大促的教训可能传承,这个是咱们要确认的第二点:人员。

第三个就是咱们要确定整体的一个流程,比如说咱们的客户端降级是在什么阶段,咱们的服务端降级、验收,是在什么阶段,压测在什么时候,还有封网,就是说整个的流程咱们要可能确定好。

通过指标、人员、打法,最初再循序渐进的一步步的履行,当然这些都是打算内的,然而大促有很多突发、应急的危险,这个时候就须要通过咱们提前的一些技术危险的治理,包含咱们应急的一些预案,而后来进行疾速的响应,最终的后果,集体感觉往年是比较满意的,因为往年在 1 号到 11 号的 11 天内基本上是全程零故障,而且咱们业务上也获得了一些播种,咱们在考拉全站云原生架构降级的我的项目外面,也获得了十分好的一些新技术的冲破和印证。

播报员:
好的,谢谢。刚刚听你说失去了整个备战期间零故障的好问题,真的是十分不错,祝贺。

看来咱们中间件团队的确下了十分多的功夫,作为队长,你感觉往年双 11 和去年有些什么不一样的中央?

涯海:
往年和去年感觉最不一样的就是咱们全面拥抱云原生这个点,因为去年的话咱们是整个阿里 IaaS 层上云,咱们叫全面上云,然而那个时候还没有涉及到咱们 PaaS 这一层。

IaaS 上云对于大多数的业务来说都是无感的或者是感知很少,然而 PaaS 上云的话,它的逻辑是跟业务代码深度耦合的,这个时候咱们业务就会有一个很强的感知,并且可能会须要做大量的改变。这个时候咱们怎么能在保障业务稳固的状况下,安稳地去实现 PaaS 的降级,这个是往年跟去年特地不一样的第一点。

第二个就是三位一体,往年从两头的视角,咱们很多外围的产品曾经减速,甚至是曾经实现了咱们自研、开源和商业化产品的全面交融,一方面能够节俭咱们外部的产品反对和保护的一个老本,也就是说能够缩小咱们的老本,另一方面也为咱们团体内走向凋谢规范的技术生态,去享受云原生的技术红利来打下了一个很好的根底,并且可能让内部的云产品失去外部大量场景的锻炼,来加强咱们服务超少量客户的产品化的能力。

这两点我感觉是往年双十一和去年双十一差别比拟大的两点。

播报员:
理解了。的确,咱们中间件产品外面其实有十分多的网红产品,就是各位开发者都用得十分多,置信屏幕前的你(观众)应该也用过,那你(观众)脑海中有呈现什么样的阿里中间件的网红产品的话,当初就能够发弹幕通知咱们。

刚刚咱们有提到,往年全面云原生化带来了很多不一样的中央,这又带来了哪些核心技术的降级呢?

涯海:
核心技术的降级的话,我感觉第一个就是咱们 Dubbo 3.0,在考拉样板间的一个落地,什么是 Dubbo 3.0?就要提到大家比拟相熟的网红的微服务 Dubbo,Dubbo 咱们当初次要是在 2.X 的版本,那么 Dubbo 2 和咱们团体外部大规模应用的 HSF 的微服务框架,它自身的兼容性不是特地好,然而 Dubbo 3.0 就能够齐全兼容咱们 2.0 和团体内的 HSF 微服务。比如说考拉,它是咱们并购的一个产品线,那么它一开始用的就是基于开源自建的一个分支,就是 Dubbo k,它在融入到阿里之后,跟阿里的电商体系去做交融互通的时候,就须要同 Dubbo 2.0 和咱们外部的 HSF 去做一个互通。这个时候咱们给出的计划就是通过 Dubbo 3.0 来实现这样的桥接,往年咱们是在考拉实现了 Dubbo 3.0 的降级和落地,明年咱们要在团体内做大规模的 3.0 的降级,这是第一点。

第二点就是咱们往年的一个中间件 4.0 的一个我的项目,什么是中间件 4.0?就是针对单集群、百万实例规模,咱们须要做的特地大的一些性能优化,包含咱们基于云原生的流量管制,还有咱们的 Mesh 服务网格的技术。往年这三项技术都获得了比拟大的冲破和成绩。

播报员:
好的。刚刚有听到你说三位一体的一个体系,这三位一体是哪三位?为什么三位一体在往年会变得如此重要呢?

涯海:
行,先说说三位一体是哪三位?首先第一个就是自研,阿里的技术一开始都是基于外部的场景,双 11 的这种电商的峰值孵化进去的很多创新型的技术,这个是联合咱们的资源高度定制,十分符合咱们阿里生态的一些技术。

第二个就是开源,随着开源的设计越来越凋敝,有很多优良的设计理念,而后包含 K8S 等这些产品,并且当初整个业界对开源也越来越认可。

第三个就是商业化,咱们当初有很多云服务提供厂商,比如说阿里云,咱们也有很多成熟的商业化产品,然而在一两年前这三位并不是交融的,可能是多个团队,每个团队做一套或者是一个团队要同时保护多个版本,因为它的代码分支、内核产品体验差别都很大,这个是由用户的场景驱动的。然而通过数年的倒退,咱们发现这三者各有劣势,但也各有劣势,这个时候咱们就须要做一个三位一体的交融,将三位交融为一体,先做一个全面的交融,这样的话咱们既能享受到咱们一些开源的优良的设计理念,拿到外部的场景,通过大量的业务场景去锻炼,而后转化成一个十分成熟的商业化产品,来为咱们外部或者内部的企业用户提供咱们“永不停机的计算服务”的指标去致力。另一方面咱们也可能同时的享受到咱们云原生的这样一个技术红利。这个是我对三位一体的一个了解。

播报员:
刚刚我记得你还有提到过说去年是 IaaS 的上云,这样对业务比拟无感知,对吧?

往年是 PaaS 的上云,须要业务进行一些相应的扭转。其实还有一种形式叫云原生上云,我想让你来给咱们解释一下,这三种上云的形式到底有什么样的区别呢?

涯海:
IaaS 层上云的话,简略解释就是你不必买服务器了,不必去自建机房了,你能够把你的利用的容器间接部署在咱们的云端,就节俭了很多物理的老本。PaaS 上云是什么?就是说不单你的客户端,就是你本人的应用程序不须要再买机器了,并且你须要应用的一些服务端的中间件技术,也不须要去自建集群,比如说你不须要去自建一个音讯集群,而后再去提供音讯服务,也不须要去自建一个注册核心或者配置核心,你能力享受这样的服务。那么我了解的 PaaS 层上云就是将咱们应用的很多中间件的技术间接变成 PaaS 化,按需的去应用,就像咱们当初 IaaS 层始终在说弹性,就是咱们须要用到多少的物理资源,就去主动的申请,而后当流量上涨它能够主动的去做扩缩容。那么 PaaS 同样是心愿往这个理念去倒退,咱们把咱们的一些中间件服务以一种计量的形式来对外提供服务,这个时候你用多少你就花多少的老本,不须要去思考它的扩展性,也不须要思考它的规模的瓶颈,比方一些互联网的新兴公司,它的成长是十分迅速的,可能它的实例规模迅速的能从 100 到 1000 到上万到甚至是 10 万,这个时候它就不须要经验阿里一代、二代、三代的这样一个技术更新,不必再去经验这样的苦楚,这是第二类。

什么是第三类?我了解云原生就是让咱们无论是 IaaS 层还是 PaaS 层的接口更加的规范,比如说尽管同样是把你的中间件服务部署在云端,那你可能会面临多个云厂商的这样的一个纠结,对吧?因为每个云厂商的规范都不一样,就像你买不同的手机,可能有不同的充电器,这个时候如果你买了两个手机,充电器可能就不能互用,然而当初大家都基于 Type- C 的充电接口,都基于这样的标准接口,也就是咱们就无论你是开源自建还是从自建迁徙到成熟的云服务厂商,都不须要再去经验买一个 USB 转换器的苦楚。这个是我集体的一个了解。

播报员:
理解了,像我这种不是技术的同学,我都能听懂,十分浅显易懂的科普,非常感谢涯海。

我有据说过一句话叫做中间件云原生化是云原生从概念到落地的承接,这句话是怎么了解?

涯海:
这句话比拟形象,我也不太好了解,我只能大略的说一下我本人的了解。我听到一个关键词就是承接对吧?

其实中间件始终是承当的承前启后的作用,就是向下的话,咱们是要充沛的去施展咱们 IaaS 层的一些技术红利,比如说当初最火的一些弹性的技术,然而咱们要屏蔽掉不同的物理设施其底层的一些差异化,无论是 K8S 还是容器化的,咱们都要去屏蔽底层的物理差别。

向上,咱们是须要提供规范的服务能力,就像我方才说的 PaaS 化一样,这个时候无论是电商业务,还是说搜寻业务或者其余的业务,无论你的业务状态是什么样,然而所应用的这种中间件的服务能力是规范的、统一的,咱们就能够去反对不同的场景,并且与此同时咱们也能够反对不同的语言,无论是 Java 的还是 C ++ 的,对外提供的接口的能力都是统一的。这个是我对“承接”一词的了解。

播报员:
我听下来感觉上是齿轮,就是一个个比拟精密的齿轮的感觉?

涯海:
不能说齿轮,我感觉它有点像适配器,可能是一个万能的适配器。只有有了它,你就能够去抉择你想要的一些能力,并且不须要思考能力之间的一个差异性,它来帮你去做屏蔽,并且你不须要思考规模,它也能够帮你去屏蔽规模带来的一些问题。

播报员:
好的,咱们这边还有最初一个问题,都说往年特地重要的一个概念就是全面云原生化,咱们往年的双 11 也成为了寰球最大规模的云原生实际。

其实咱们都晓得阿里在近几年来始终都在做云原生基础设施的降级,基础设施整体降级当前,云原生中间件将如何重构降级呢?如何把底层基础设施更好的弹性,通过中间件赋能给下层业务?

涯海:
咱们当初在做这样几个事件,第一个就是咱们本人要去拥抱云原生带来的变动,比如说往年咱们两头本人就做了有状态利用的 AIS 化,也就是 KMS,也就是咱们要把咱们本人的利用变成随时能够迁徙、主动调度的,而后通过这种调度的形式解决一些单机故障,来进步咱们整体集群的稳定性。

第二点咱们要把本人的很多能力去包装成一些 CRD 或者是其余的一些形式,可能让用户更加轻量化地、更加无效地去定制本人的一些需要。

第三个就是说咱们要去面对多语言的场景,要去通过一些服务网格的技术比如说 Mesh,去反对一些异构场景以及多元互通的诉求,这个是咱们要做的第三点,当然还有很多其余的点,我就不一一介绍了。

总得来说,之前一篇文章中有有一个比喻,咱们都晓得珠穆朗玛峰很高对吧?它是一个 8848 米的平地,极度缺氧、酷寒的一个环境,这个时候咱们去攀登这样一座顶峰的时候,就须要借助一些设施,比如说咱们的防寒衣,咱们的氧气罐,咱们通过这些设施来帮忙咱们更好地去攀登咱们的高峰,咱们的一些中间件的技术就是帮忙大家去实现这样的这样的一个指标。

当然咱们更心愿帮忙大家做的事件就是通过云原生中间件技术的降级,可能帮忙业务自身也实现云原生化的转型,就有点像咱们摈弃了氧气罐,摈弃了防寒衣,就像生存在珠穆朗玛峰下面的一些冰熊等一些原生的动物一样,咱们间接适应了云原生的环境,适应了整个云原生的个性,这个时候咱们就能更加充沛地去施展咱们云原生技术红利的劣势。

播报员:

其实咱们屏幕前有十分多的开发者,也用了很多阿里中间件的技术,也十分想把阿里中间件的技术学好。

对于这些开发者来说,你有什么好的倡议给到他们吗?

涯海:
首先非常感谢大家可能喜爱,可能反对咱们阿里的这些技术。咱们阿里中间件最近几年也花了大量的人力投入在咱们整个开源社区的建设下面,比如说咱们的几个明星产品,比如说微服务 Dubbo,还有咱们的音讯产品,还有 RocketMQ 当初也是 Apache 的顶级我的项目产品,还包含咱们的软负载,以及等等一系列的产品,这些产品咱们都有在发展社区去奉献,同时咱们团体外部的产品和咱们商业化的产品也在进行交融,而且咱们的内核也都是基于这样的,如果大家感兴趣的话,我是倡议大家先从开源参加进来,而后在参加开源的过程中也能够尝试本人搭建一些集群去学习一下,甚至能够利用在你的生产零碎外面。然而当你的规模和体量逐步增长的时候,你可能会遇到更加浅近的比如说稳定性或者是扩大的一些问题,这个时候就能够多跟咱们的同学一起交换,咱们也有很多开发者社区,并且很多外部的同学都是技术极客,包含我本人,都是十分违心跟大家一起去交换这些技术话题的。

播报员:
好的,最初我就着刚刚咱们涯海的话题打一个小广告,咱们当初其实正在筹备云原生的课程,12 月也会公布云原生微服务的学习路线,都在阿里云开发者社区,大家能够去继续关注,并且学习起来,Get 同款网红中间件产品的技术。

咱们明天的访谈就到此结束了,非常感谢屏幕前的你在这段时间里跟咱们一起交换和学习,也非常感谢咱们明天的嘉宾涯海来加入咱们明天的访谈,谢谢大家。

涯海:
好,谢谢莫孤,最初我也打一个广告,对如果大家对阿里的技术感兴趣,对中间件建感兴趣,心愿可能独特地去定义将来的云原生,欢送大家退出咱们,跟咱们一起致力。

原文链接
本文为阿里云原创内容,未经容许不得转载。**

正文完
 0