运维 关于运维:月活近千万连续-365-天无故障货拉拉怎么做稳定性指标度量 每一位被故障折磨的稳定性负责人,都或多或少面临自证的窘境:如何证实往年的稳定性工作是杰出的?在无奈完全避免故障产生的前提下,如何证实稳定性保障工作…
运维 关于运维:使用-OpenTelemetry-构建可观测性-06-生态系统 过来的五篇文章探讨了如何应用 OpenTelemetry 来构建可观测性的技术细节。我认为在本博文系列的结尾介绍无关 OTel 生态系统的信息,为读者提供更全面的理解非…
运维 关于运维:使用-OpenTelemetry-构建可观测性-05-传播和行李Propagation-Baggage 咱们开发的应用程序可能具备不同的状态和架构:有些是单体利用,有些是微服务。为单体应用程序增加遥测数据相对来说简略,因为所有数据都在同一过程中。然而…
运维 关于运维:为什么企业需要IT服务管理 什么是IT服务治理?将IT服务治理性能扩大到技术服务之外,解决以业务为核心通过繁多平台,门户和服务目录治理服务供需,通过PaaS/低代码开发工具减速翻新和工…
运维 关于运维:蓝鲸rabbitmq监控实践 rabbitmq是蓝鲸所依赖的音讯队列服务,影响着多个服务,如作业平台、规范运维、监控平台、节点治理、日志平台等。因为rabbitmq服务异样而导致的故障往往比拟…
运维 关于运维:单台机器安装体验蓝鲸71 本文来自腾讯蓝鲸智云社区用户:donkey应用一台服务器,既是k8s master节点又是node节点。根底环境信息系统:CentOS 7.9CPU/内存: 64C/128G机器信息k8s环境…
运维 关于运维:国内用户访问-Github-速度慢怎么办别慌一招帮你解决看这 对于咱们从事 IT 行业的技术人员来说,对于 Github 必定是十分相熟的。日常工作中必备的工具之一,因为时常遇到无法访问、或者访问速度很慢的问题,导致应用…
运维 关于运维:使用-OpenTelemetry-构建可观测性-04-收集器 在之前的博文中,咱们探讨了如何应用 SDK 和链路追踪生产者来导出过程中的遥测数据。只管有多种类型的导出器可供选择,但其中一个常见的指标是将数据导出到 O…