共计 2382 个字符,预计需要花费 6 分钟才能阅读完成。
7 月 27 日,2021 可信云大会在北京召开。会上,阿里云故障演练平台入选可信云最佳技术实际,并首批通过可信云混沌工程平台能力要求最高等级 - 先进级认证。同时,由信通院牵头,阿里云计算有限公司联结多家企业独特发动的“混沌工程实验室”发表成立。
双项认证,阿里云故障演练平台获可信云最高等级认证
随着企业对于云计算的了解和实际不断深入,基于云计算的分布式架构成为越来越多企业应用构建的首选计划,如何通过混沌工程晋升云原生零碎稳定性和保障业务连续性成为业内广泛关注的话题。
混沌工程是次要通过故障注入的形式,提前发现零碎稳定性等问题,旨在晋升零碎和组织韧性,打造韧性的架构,保障业务连续性。在信通院可信云混沌工程平台测评中,阿里云故障演练平台以最高分问题通过资源反对、故障场景、场景治理、试验流程、试验防护、试验度量、权限治理、平安审计等 8 项能力测评,并入选 2021 可信云最佳技术实际,双项认证,再一次证实了阿里云在混沌工程畛域的技术和产品实力。
故障演练随着阿里巴巴零碎架构从微服务,到容器化,再到云原生一起倒退,外部已有近 10 年的混沌工程落地实践经验。阿里云故障演练平台将阿里巴巴外部的实践经验以产品化的形式对外输入,提供丰盛的试验场景和专家教训库、畛域化的解决方案,满足用户的故障场景需要,在灵便的流程编排和凋谢的集成能力下,提供监控、报告等实现混沌工程施行闭环,通过权限管控和演练防护来管制故障演练的危险,帮忙企业在云迁徙、云就绪、云原生过程中晋升零碎稳定性和业务连续性。
自混沌工程实践提出以来,很多企业在摸索和实际,但落地模式不同,阿里云故障演练平台有何不同?
- 灵便的流程编排:制订了一套标准化的演练流程,在此基础上能够增加所需的流程节点。同时反对多场景的运行形式。
- 可视化故障演练:与架构感知集成,在架构拓扑可视化的根底上,实现故障注入,同时能够配合架构巡检,发现零碎危险点,应用故障演练进行验证。
- 多样的专家教训库:将阿里巴巴外部多年的故障演练教训积淀到演练模板中,具备演练场景的真实性和实用性,极大的晋升演练创立的效率,同时解决用户上手混沌工程难的问题。
- 畛域化的解决方案:提供对服务组件、零碎架构等稳定性验证的产品化解决方案,通过架构感知、依赖剖析等动静辨认组件和架构,主动生成演练计划,达到快、准、全的演练目标。
应用故障演练平台做混沌工程,能够掂量微服务的容错能力,估算零碎容错红线,掂量零碎容错能力。并且,故障演练平台能够验证容器编排配置是否正当,测试 PaaS 层是否强壮,验证监控告警的时效性,晋升监控告警的精确和时效性。通过故障突袭,随机对系统注入故障,考查相干人员对问题的应急能力,以及问题上报、解决流程是否正当,达到以战养战,锤炼人定位与解决问题的能力。通过故障注入的形式,提前发现零碎稳定性等问题,旨在晋升零碎和组织韧性,打造韧性的架构,保障业务连续性。
阿里云故障演练平台自 2019 年商业化以来,通过多样化的试验工具,自动化的工具部署,多维度的演练形式,灵便的流程编排,丰盛的故障场景,实用的演练模板,业余的解决方案,平安的演练防护,深度的云产品集成,曾经领有近千个企业客户,服务了包含华泰证券、比心科技、亲宝宝等客户,助力企业在云原生时代构建数字韧性能力。
推动规范对立,打造 ChaosBlade 开源我的项目,缩短构建混沌工程门路
近几年,越来越多的企业开始关注并摸索混沌工程,慢慢成为测试零碎高可用,构建对系统信息不可短少的工具。但混沌工程畛域目前还处于一个疾速演进的阶段,最佳实际和工具框架没有统一标准。施行混沌工程可能会带来一些潜在的业务危险,教训和工具的缺失也将进一步阻止 DevOps 人员施行混沌工程。混沌工程畛域目前也有很多优良的开源工具,别离笼罩某个畛域,但这些工具的应用形式千差万别,其中有些工具上手难度大,学习老本高,混沌试验能力繁多,使很多人对混沌工程畛域望而生畏。
阿里巴巴团体在混沌工程畛域曾经实际多年,为了帮忙企业更好地构建混沌工程门路,阿里巴巴在 2019 年开源了混沌工程项目 ChaosBlade,并在往年成为 CNCF Sandbox 我的项目。将 ” 自研技术 ”、” 开源我的项目 ”、” 商业产品 ” 造成对立的技术体系,阿里云通过三位一体的正向循环,实现了技术价值的最大化。
ChaosBlade 是一款遵循混沌工程原理的开源工具,蕴含混沌工程试验工具 chaosblade 和混沌工程平台 chaosblade-box,旨在通过混沌工程帮忙企业解决云原生过程中高可用问题。试验工具 chaosblade 反对 3 大零碎平台,4 种编程语言利用,共波及 200 多个试验场景,3000 多个试验参数,能够精细化地管制试验范畴。ChaosBlade 已成为阿里云故障演练平台根底能力底座服务泛滥企业客户。
将来,ChaosBlade 将持续以云原生为根底,提供面向多集群、多环境、多语言的混沌工程平台和混沌工程试验工具;后续会托管更多的混沌试验工具和兼容支流的平台,实现场景举荐,提供业务、系统监控集成,输入实验报告,在易用的根底上实现混沌工程操作闭环。
业内首个混沌工程实验室正式成立,推动混沌工程实际落地
在数字化产业对系统稳定性和云计算高可用要求越来越高的大背景下,由中国信通院牵头,阿里云等泛滥企业独特参加的混沌工程实验室正式成立。混沌工程实验室将推动混沌工程在各畛域典型利用场景中的实际落地,联动云计算上下游企业来独特推动混沌工程疾速倒退。
阿里云领有国内最丰盛的混沌工程实践经验,并致力于打造云原生时代的混沌工程规范体系。阿里云在海量互联网服务以及历年双 11 场景的实际过程中,积淀出了包含全链路压测、线上流量管控、故障演练等高可用核心技术,并通过开源和云上服务的模式对外输入,以帮忙企业用户和开发者享受技术红利,进步开发效率,缩短业务的构建流程。