关于阿里云:企业云原生IT成本治理案例解析-中华财险云原生上云IT成本治理之路

34次阅读

共计 2293 个字符,预计需要花费 6 分钟才能阅读完成。

作者:莫源

前言

中华财险是国内互联网金融行业的领导者,在企业云原生上云的过程中,实现了大量多租 SaaS 化业务的微服务化和容器化。其业务具备十分典型的金融属性,对架构稳定性、资源老本效率、数据安全等方面都提出了更高的要求和挑战,须要在实现降本增效的同时兼顾业务稳定性。在迁徙的过程中,遇到了多租业务清理老本难、闲置 / 浪费资源发现难、优化策略与业务稳定性均衡难等挑战。中华财险工程师团队基于阿里云企业云原生 IT 老本治理计划积淀了一套成熟的 IT 企业老本治理流程与零碎,通过开箱即用的业务老本拆分、闲置资源可视化发现、弹性伸缩与混部等优化策略,将集群的闲置资源率从上云前的 30% 优化到 10% 以内。

中华财险的上云 IT 老本治理工作也荣获信通院 2022 年度云管和云网优良案例:https://mp.weixin.qq.com/s/XB…

中华财险的云原生之路

云原生上云是目前企业上云的最佳门路,中华财险作为国内互联网金融行业的领导者也在驱动业务通过微服务化、云原生化的形式实现数字化转型。在云原生上云之前,中华财险的业务存在如下问题:

  • 业务资源的管理权限扩散在各个团队,生产环境和测试环境下沉在业务团队,业务团队为长期验证的版本冗余了大量的资源。
  • 局部业务有显著的周期性,峰谷容量相差较大,造成资源低负载运行工夫较长。
  • 压测环境单位工夫内须要大量的长期机器,复用闲置资源须要腾挪机器、协调跨团队资源,流程和老本较高。
  • 短少可量化的指标发现业务的节约,单纯的利用率指标不能作为节约的评判规范。

为了解决上述问题,中华财险工程师团队通过业务的微服务化、容器化的形式,将业务迁徙到了阿里云容器服务之上,基于阿里云企业云原生 IT 老本治理计划积淀了一套成熟的 IT 企业老本治理流程与零碎,将 IT 老本的治理周期从原来的季度、月度,升高到了周、天。通过开箱即用的老本可视化与摊派能力,实时掂量团队资源节约状况,实现数字化的降本增效。

上面是一些优化过程中的要害门路:

  • 通过命名空间进行多租业务的逻辑治理、财资拆分、节约掂量

中华财险工程师团队将多租的 SaaS 化业务通过命名空间作为逻辑单元在同一个集群中进行对立治理,通过调整 Request 与 Limit 之间的比例,将原有独立容量治理的模型,转变为池化对立治理,晋升资源的利用率。通过阿里云企业云原生 IT 老本治理计划提供的命名空间成本核算的能力,在一个集群内能够轻松实现不同业务的费用摊派,实现容量治理与财资治理。

通过 ACK 老本剖析发现集群节约状况以及各利用老本散布

  • 全量路压测进行容量预估与可靠性验证

在进行云原生化的过程中,中华财险工程师团队发现,业务团队提交的容量估算与理论的资源应用存在比拟大的偏差。因而,在上云的过程中,中华财险工程师团队通过应用 PTS(阿里云全链路压测服务)高仿真模仿环境全链路压测,确定零碎水位和瓶颈,正当预估资源需要,将老本规模通过数字化的指标进行了建模,在保障集群容量可靠性的前体下,实现了老本规模的管制。

  • 建设老本节约的衡量标准,发现节约状况

单纯通过资源利用率的数值来判断业务是否存在节约从理论场景上来看是不够有说服力的,业务团队冗余容量的策略个别会基于业务峰值的状况、程序高效运行的利用率区间、将来业务倒退的状况等因素。在传统的老本治理周期以月度、季度甚至年度等更长时间的状况下,冗余是保障稳定性的最佳抉择。为了解决这个问题,中华财险工程师团队提出了利用节约度模型,通过联合资源利用率、波峰波谷振幅、业务断路器引入、业务老本趋势变动等多个因素进行整合,数字量化节约比例,无效的发现了集群内的实在节约状况。

通过 ACK 老本剖析发现集群利用的节约状况

  • 分时混部在线业务与长期业务错峰应用

在中华财险的业务场景中,有大量的长期工作、仿真工作,这些工作具备周期短、资源耗费低等个性,中华财险工程师团队发现集群的实在使用率在白天始终处在比拟低的程度,而闲暇的工夫足够仿真工作和长期工作的执行。此外,在应用分时复用的时候,还配合了快上快下的抢占策略,既保障了集群的整体利用率晋升,又可能在突增流量到来的时候,下线长期作业保障业务的整体的稳定性。

  • 定时伸缩实现外围业务资源预供应

中华财险有些业务存在显著的周期性和波峰波谷,资源比例相差数倍,在保障肯定冗余的状况下,通过应用定时伸缩的形式,能够让出更多的集群的调度资源,让其余的长期作业能够跑得更快。

  • 闲置资源回收与业务弹性交付

当资源池化后,因为不必节点的调度策略打标和束缚,会造成局部节点的调度水位较低,通过辨认长时间低水位的节点的形式,能够发现集群中的闲置资源状况,升高资源节约。并把一些低频度的资源交付通过弹性的形式进行优化,实现老本效率的进一步晋升。

中华财险基础设施团队一路走来,经验了线上生产业务从传统 IT 架构到上云、上云原生的过程,在这个云原生化的过程中,中华财险的业务量也翻了数倍。通过云老本优化的一系列措施,某业务容器化后总升高配置:232C 400G,节俭约 7 台 32C 64G 的 ECS 的云计算资源,升高了约 20% 的服务器老本。在进行了混部、业务顶峰低谷的弹性伸缩等优化后,均匀老本优化率可达约 15%。

最初

从某种角度而言,中华财险基础设施团队的架构优化策略是十分奢侈和实用的,通过数字化、模型化、可视化企业 IT 老本,用数据领导和优化 IT 老本治理,将集群的闲置资源率从上云前的 30% 优化到 10% 以内。企业 IT 老本治理向来不是新技术的试验场,抉择适合本身状况的计划,用数据量化后果,有理有据地驱动企业降本增效。

相干文章:

《阿里云首家通过《可信云·云老本优化工具能力要求》评估,云原生企业 IT 老本治理计划助力企业 FinOps

正文完
 0