关于运维:畅聊云时代的可观测性实践

3次阅读

共计 3398 个字符,预计需要花费 9 分钟才能阅读完成。

我认为,在将来 3 年内,这三个类别——APM、监测 / 指标、日志,可能还有其余类别——都可能不复存在。将只存在一个类别:可观测性。并且它将蕴含您须要理解的,零碎能够进入任何状态所需的所有见解。——Charity Majors, CEO Honeycomb

近日,由中国信通院公布的《中国数字经济倒退报告(2022 年)》数据显示,中国数字经济倒退始终出现稳中向好的倒退态势,产业规模继续快速增长,已数年稳居世界第二。在 2021 年,中国数字经济规模已超 45 万亿元,占国内生产总值 39.8%,在国民经济中的位置更加巩固、撑持作用更加显著。在产业数字化转型提速降级过程中,基于云计算的技术创新与产品利用起到了重要作用,从底层的基础设施框架,到下层的业务流程定义,都在继续进化并已颠覆很多传统思维与模式。往年,又诞生许多新热点技术和办法,「可观测性」(Observability)成为其中佼佼者之一。

 日趋成熟的可观测性工具,配合已实际多年的「系统可靠性工程」(SRE),突破了对原有开发运维体系的认知瓶颈。零碎自身是否具备可观测性,和是否有适合的可观测计划守护,已成为是否保障系统稳定性的最要害前提。运维不再限度于僵化的变更流程,开发能够随时享受可编程基础设施带来的便当,测试和平安加固贯通整个开发运维过程,零碎所有的实时运行状态都尽在掌控,潜在的危险可被提前预测,用数字化的伎俩,才是治理数字零碎的最佳计划。大型企业或可凭借本身弱小的技术实力与持续性的产研投入,自建一套全链路可观测平台,但即便如此,随着利用一直迭代,或技术栈版本疾速更新,仍要面对频繁调整监测参数的微小工作量;若中小企业或初创团队,仅建设这样一套全链路可观测平台,就已大大超出其技术和运维能力接受范畴。

  8 月 27 日,观测云首席布道师——吴亚昆作为「DataFunSummit2022:数据治理在线峰会」的「数据可观测性」主题论坛出品人,特地邀请到了观测云、睿象云、货拉拉、中国 SRE 联盟、阿里云、同创永益等业内知名企业和团队的技术专家,在线分享探讨具备代表性的超大平台可观测性解决方案与行业实际,以及如何让初创企业也能开启全面可观测能力的落地场景。观测云与合作伙伴的利用实际摸索 1、睿象云:告警,为可观测性平台剖析提供牢靠「景象」睿象云技术总监王金良从可观测性的整体状态登程,围绕告警在可观测零碎的外围性能、价值和最佳实际开展,发表《可观测零碎中的告警治理实际》主题分享。王金良示意,可观测性并不是在取代监控,它更像是形容一种属性的领域,是一种能力的体现模式,越简单的零碎越须要这种属性或能力。

告警作为 IT 运维信号总量的金字塔尖,对于可观测性接下来的流转及判断起着至关重要作用。而对立的、精确的、智能化的告警平台的诞生,为可观测性平台的剖析,提供了更为牢靠的「景象」,可帮忙运维人员接下来剖析起因疏导方向。2、观测云:数据治理视角下的可观测性观测云高级技术专家张田发表《数据治理视角下的可观测性》主题分享,并以数据资产治理场景为例,深入浅出地论述可观测性对系统稳固运行的重要性。张田示意,「可观测性」示意收集一个零碎的所有指标、日志以及链路追踪数据,并通过肯定的治理伎俩使这些数据有机联合,以适合的形式出现进去,最终帮忙用户更好地来了解和解释零碎以后所处的状态。

 以数据资产治理场景为例,治理后资产用什么形式对下层利用提供服务,这些对外服务如何管控,谁应用了数据,用了多少数据,应用体验如何,都是对治理成果的一次定量化掂量。这个掂量过程的外围就是零碎的可观测性。观测云目前的对立可观测能力曾经十分成熟,实现这个能力的根底就是数据关联,做到对立数据展现、数据查问、数据分析与数据报表展现。3、货拉拉:依靠弱小的技术团队,实现全链路可视化监控在本期主题论坛现场,货拉拉架构师曹伟带来《货拉拉全链路监控的落地与实际》精彩主题分享。曹伟介绍道,货拉拉成立于 2013 年,是互联网货运物流市场中的头部品牌,随着货拉拉的业务规模一直壮大,原来的零碎架构已无奈满足业务需要,因而自 2020 年起,货拉拉便着手对业务系统监控全面改革。依靠弱小的技术团队和深厚的技术积攒,历经两年重重测试与一直调整,货拉拉串联 Metric、Trace、Log 和业务,实现全链路可视化监控闭环,实现「所见即所得」的监控可视化建设。

曹伟现场示意,货拉拉自研的可观测零碎得益于公司多年深厚的技术积攒和研发恒心,目前货拉拉监控 3.x 已实现疾速定位、全局稳定性、微服务治理、高 ROI 等成果,将来将对自研存储、根因剖析、指标告警联动、服务拓扑、回馈开源社区等方面继续投入。4、中国 SRE 联盟:首席布道师刘峰:SRE 的核心理念与可观测性 在本次「数据可观测性」主题论坛直播间,中国 SRE 联盟首席布道师刘峰为观看直播的观众带来《SRE 的核心理念与可观测性》精彩主题演讲。刘峰示意,分布式、简单的服务以不可预测的用户和可变吞吐量大规模运行,这意味着有数百万种不同的办法出错,但却不能预测它们,将服务的所有输入内部化,使咱们可能推断该服务的外部状态,即服务的可观测性是建设云时代 IT 零碎时的刚需。随同 DevOps、SRE 的全面到来和技术栈继续降级迭代,可观测性与 SRE 工程、开发和运维、利用与零碎环境、软件工程与系统工程等之间逐步造成引入和推动的「奇点」效应:同根同源,共生共进;无中生有,有中生新。

 SRE 工程、可观测性技术与利用实际的最终目标,都是通过新兴科学技术构建稳固的零碎,用牢靠的服务晋升企业交付价值,助力数字化业务增长。5、SLS:云原生可观测平台,助力业务数字化翻新随着云计算技术一直降级,承载业务的 IT 基础设施规模扩充,各个利用之间的链路关系变得越来越简单,每时每刻都在产生海量级的日志。对日志数据的采集、存储与剖析解决形式,是掂量企业零碎数字化水平的重要标记。

 来自阿里云的智能产品专家孟威示意,面对业务数字化,传统的 IT 运维计划存在多种挑战,须要能买通可观测数据,疾速根因诊断与问题定位,不便易用的新一代运维计划。日志服务 SLS,可提供一站式日志数据采集、加工、查问与剖析、可视化、告警、生产与投递等性能,全面晋升研发、运维、经营、平安等场景的数字化能力。6、同创永益:数字韧性,数字化业务连续性下一站同创永益郑阳作为最初一位嘉宾出场,带来《数字韧性:数字化业务连续性下一站》主题分享。郑阳示意,企业上云在为业务增长带来晋升的同时,也带来了新的危险与挑战。随同业务云化水平加深,最大的挑战就是零碎链路的复杂性,一个小的变更就有可能触发大面积的零碎凌乱、故障和服务中断。

混沌工程的呈现,让人们对简单分布式系统在生产环境中抵挡突发事件的能力有了信念。利用混沌工程可验证、保障系统稳定性,比方在 Kubernetes 平台上疾速验证其高可用性、弹性、可观测性。纵观全国上下各企业的可观测性建设,目前广泛处于摸索阶段,但站在中国可观测性的终点,从技术范式颠覆的视角来看,零碎的可观测性将成为企业数字化转型的典型特色。中国的可观测性始于观测云作为中国可观测性畛域的领头羊,观测云自往年 4 月正式公布以来,已荣获中国信通院颁发的「可观测性平台技术能力」最高级别「先进级」认证、可信云企业级 SaaS 服务认证等多项国家级奖项,入选 CNCF 云原生全景图的 Observability and Analysis 板块,全面兼容 OpenTelemetry,数据接口全副凋谢。此外还提供弱小的自定义编程性能,可接入物联网、云平台账单等各种跨平台数据源。

除提供开源组件外,观测云还反对 SaaS 版按量计费模式,以及全功能的,能够本地部署的「社区版」供宽广技术爱好者收费试用体验,极大升高了可观测能力平台的建设门槛,让初创团队甚至集体,都能够疾速体验到最先进和残缺的可观测能力。

 聪慧的团队会观测,一个成熟的技术团队就应该把握通过数据视角去剖析问题,对立地建设整个零碎可观测性是 DevOps 和 SRE 可能落地的充沛必要条件。观测云始终保持以数据为外围、价值为驱动,秉承凋谢翻新倒退的理念,继续加强技术与产品研发投入,提供优质的可观测性产品体验,助力企业、技术团队及集体零碎的可观测性零碎建设,为企业数字化转型提供最大化的价值,并携手各方生态合作伙伴,独特为中国可观测性的倒退贡献力量。

正文完
 0