背景
云原生计算基金会(Cloud Native Computing Foundation,CNCF)正式将可观测性引入 IT 畛域以来,可观测性市场迅猛发展,涌现出一大批可观测性解决方案,企业也在寻求不同的形式打造可观测性。
然而,传统的监控厂商与新生的可观测性厂商,均应用了雷同的术语与概念,这导致用户对于可观测性的定义变得含糊,甚至很难辨别哪些是真正的可观测性计划。同时,企业不足掂量和评估软件系统外部可观测性的框架或办法,也不足反馈可观测性体系建设成熟度程度的框架或办法。
在此背景下,由稳定性保障实验室领导,龙蜥社区、乘云数字等单位独特编写的国内首份《可观测性成熟度模型白皮书》正式公布(以下简称“白皮书”)。《白皮书》具体介绍了可观测性成熟度模型的设计思路,系统性地梳理了各成熟度阶段的能力特色,以帮忙企业理解其以后的可观测性建设程度,并为其提供改良的思路。
钻研思路
龙蜥社区在可观测性畛域进行了很多实际,例如把某个或某类具体的利用,作为咱们的监控对象,通过从监控对象在运行过程中的状态、指标、日志,以及其链路上产生的 RT 提早、微服务调用状况进行汇总,利用智能剖析算法给出问题根因论断和修复倡议,并依据指标趋势对将来零碎运行的状况进行预测,尝试把监控、智能诊断和可观测能力进行联动,让用户知其然又知所以然。
就在一个月前,龙蜥社区零碎运维 SIG 公布了 SysOM 3.0 个性,其中基于利用的可观测性能,试图从利用的视角开掘业务呈现问题后的由上到下的根因剖析能力,实现零碎指标与利用表象的关联,实现从监控到诊断、网络拓扑及链路追踪到 AI 智能化剖析的进阶。
SysOM 的产品力也逐步从底层指标监控、可观测三大支柱数据的采集,回升到 AI 算法加持得出根因论断的能力跃迁,将来也会逐步往故障预测预警、晋升商业化(降低成本、减少业务营收、辅助商业决策)等终极能力进发。
此次《白皮书》编写,也进一步加深了咱们对可观测性零碎的了解,它肯定水平上体现了龙蜥社区在可观测性畛域的摸索门路,也体现了咱们手不释卷谋求的“观测,让运维更简略”的理念。
正如这首打油诗所总结的:
莫听监控繁冗声,何妨观测且徐行
智能诊断快胜马,一键运维定乾坤
内容概览
《白皮书》历经数月精心编写,旨在为企业、工程师和技术领导者提供一种结构化办法,以评估、进步和优化其软件系统的可观测性程度。
《白皮书》首先介绍了可观测性的发展趋势,为什么须要可观测性成熟度模型,并基于此,进一步的论述了可观测性成熟度模型的五个阶段的内容。这五个级别代表了不同的可观测性程度和能力,从最根本的监控到与业务指标紧密结合的高级可观测性。
通过以下链接能够下载白皮书内容:
https://openanolis.cn/assets/static/ 可观测性成熟度模型白皮书.pdf
模型概要介绍
成熟度模型是一种十分实用的工具,帮忙组织评估、改良和倒退其可观测性能力。通过这套模型,组织能够进行自我评估,还能够疏导组织朝着更高水平的可观测性倒退。通过该模型明确的步骤,咱们能够进步组织内的可观测性,从而为客户提供更牢靠和更具备弹性的零碎或程序。
成熟度级别越高,IT 零碎会变得更加弹性和牢靠。咱们将可能更快地解决问题的根因,理解变更、故障对业务的影响,并最终为客户提供更好的体验。
借助可观测性成熟度模型,组织能够明确倒退的路线,使其可能全面把握零碎和应用程序的状态和性能,及时做出反馈并解决问题,实现对业务的可继续监测和优化。
该模型设计了五个级别,别离是:
Level 1:监控(Monitoring)
在这个阶段,咱们关注于如何确保零碎的各个组件依照预期失常运行。这一阶段的次要指标是实时监测组件的衰弱状态,出现异常状况时,零碎会主动触发警报,告诉相干人员。
Level 2:根底可观测性(Basic Observability)
在这个阶段,咱们旨在深刻理解零碎不失常运行的起因。这一阶段的次要指标是通过采集“三大支柱数据”来洞察零碎外部状态,以便明确理解为何零碎呈现问题。
Level 3:因果可观测性(Causal Observability)
在这个阶段,咱们致力于找到问题的根本性起因。以及如何防止相似问题再次发生。在此阶段,咱们引入了网络和拓扑数据,以构建更为全面的零碎外部了解。
Level 4:被动可观测性(Proactive Observability)
这一阶段,咱们的指标是实现自动化的根本性起因剖析,自动化的响应与处理,以及智能化的预测与危险阻断。
Level 5:业务可观测性(Business Observability)
在可观测性成熟度模型的最终阶段,咱们关注的是从业务角度深刻洞察,以确定系统对业务的影响,并从中获取降低成本、减少业务营收、晋升转化率等方面的洞察,辅助商业决策。
可观测性成熟度模型的每个级别都必须建设在前一级别曾经建设的根底之上,每个级别新增的能力,都应该有助于实现更深度的可观测性能力。
总结
本次《可观测性成熟度模型白皮书》的公布,能够帮忙企业确定在可观测性畛域的地位,并为前进方向提供指引。它可能为组织提供一种系统性的办法来评估、改良和晋升其可观测性体系建设,更有针对性地倒退可观测能力、优化资源分配并继续改良。企业通过正当利用该模型,能够更好地应答古代软件系统复杂性带来的挑战,实现更杰出的用户体验,进步系统可靠性,并在竞争强烈的市场中获得劣势。
更多龙蜥白皮书内容,点击这里查看。
相干链接:
2022 龙蜥社区全景白皮书(或公众号【OpenAnolis 龙蜥】回复关键字“白皮书”获取)
https://openanolis.cn/openanoliswhitepaper
—— 完 ——