关于阿里云:可观测实践|如何使用阿里云-Prometheus-观测-ECS-应用

1次阅读

共计 3836 个字符,预计需要花费 10 分钟才能阅读完成。

作者:颍川

引言

Prometheus + Grafana 曾经成为云原生时代的可观测性事实标准。咱们应用 Prometheus 观测云原生时代的 Kubernetes 体系下的 Node、ApiServer、workload 等的根底 metric,同时通过 Prometheus Exporters 采集各种组件(如 Redis、Kafka 等)和业务利用的 metric,最初通过 Grafana 展现大盘、AlertManager 进行告警,实现了云原生 Kubernetes 体系下 metric 可观测闭环。

因为大量非云原生的历史零碎演进到云原生体系是个长期间过程,因而这些非云原生零碎的可观测闭环也是咱们必须解决的问题。咱们很天然地想到“既然 Prometheus + Grafana 实现了云原生体系的 metric 可观测闭环,是否能够应用这套神器来解决非云原生体系利用的同样问题呢?”,答案是必定的。

本文介绍如何应用阿里云 Prometheus 来实现非 Kubernetes 利用(即 ECS 利用)的 metric 观测。

ECS 利用的典型部署场景

场景 1:纯私有云 VPC

业务利用部署在一个或多个 VPC 内,每个 VPC 内购买了一批 ECS,在这些 ECS 上部署了根底组件(数据库和中间件等)和业务利用。此场景下,咱们须要对这些 ECS OS(Linux 或 Windows)、根底组件和业务利用自身进行 metric 观测。

场景 2:私有云 VPC+ 线下 IDC

业务除了部署私有云 VPC 上外,还须要与线下 IDC 机房进行互通互联。通常,咱们应用专线形式买通云上 VPC 和线下 IDC 机房。此场景下,咱们冀望有一套残缺的 metric 观测平台,同时解决线上 VPC 和线下 IDC 的 metric 观测。

场景 3:私有云 VPC+ 多云 ECS

业务除了部署在阿里云 VPC 上外,还通过公网与其它云上的 ECS 进行互通互联。此场景下,咱们也冀望有一套残缺的 metric 观测平台,实现一体化全局视角观测。

自建 Prometheus 观测 ECS 利用的痛点

自建 Prometheus 观测 ECS 利用,咱们将面临的典型问题有:

  1. 因为平安、组织治理等因素,用户业务通常部署在多个互相隔离的 VPC,须要在多个 VPC 内都反复、独立部署 Prometheus,导致部署和运维老本高。
  2. 每套残缺的自建观测零碎都须要装置并配置 Prometheus、Grafana、AlertManager 以及各组件 Exporter,过程简单、施行周期长。
  3. 短少与阿里云 ECS 无缝集成的服务发现(ServiceDiscovery)机制,无奈依据 ECS 标签来灵便定义抓取 targets。如果自行实现相似性能,则须要应用 Golang 语言开发代码(调用阿里云 ECS POP 接口)、集成进开源 Prometheus 代码、编译打包后部署,实现门槛高、过程简单、版本升级艰难。
  4. 罕用组件的开源 Grafana 大盘不够业余,短少联合观测组件的原理和最佳实际进行深刻定制。
  5. 短少罕用组件的告警项模板,须要用户自行钻研、配置告警项,工作量大,且很可能短少各组件畛域的业余技术积淀。

阿里云 Prometheus 监控的能力框架

阿里云 Prometheus 监控 [ 1] 是一款全面对接开源 Prometheus 生态,反对类型丰盛的组件观测,提供多种开箱即用的预置观测大盘,且提供全面托管的混合云 / 多云 Prometheus 服务。除了反对阿里云容器服务、自建 Kubernetes、Remote Write 外,阿里云 Prometheus 还提供混合云 + 多云 ECS 利用的 metric 观测能力;并且反对多实例聚合观测能力,实现 Prometheus 指标的对立查问,对立 Grafana 数据源和对立告警。其逻辑架构如下示意:

对于 ECS 利用,阿里云 Prometheus 提供以下 metric 数据采集形式:

  • 托管 exporter:提供 MySQL、Redis 等数十种常见组件 [ 2](继续更新中)的托管部署。用户只须要在阿里云 Prometheus 控制台配置观测组件相干信息(如 IP 地址、端口等),即可实现 VPC 内 ECS 上这些组件的 metric 监控。因为线下 IDC 通过专线与 VPC 互通,因而托管 exporter 同时也能采集到线下 IDC 内的组件 metric。
  • 非托管 exporter:对于咱们暂未提供托管 exporter 的组件,或用户业务利用的自定义 metric,用户能够在 VPC 或 IDC 内部署自定义 exorter,而后在阿里云 Prometheus 管制台上配置自定义服务发现(ServiceDiscovery),最初阿里云 Prometheus 被动发现这些 exporter,并定时抓取和存储 metric。
  • Node/Windows exporter:它们是一类非凡的非托管 exporter,因为须要部署在每台 ECS 上,以便采集 ECS OS 上观测信息。阿里云 Prometheus 提供了 Node exporter 的原生反对,Windows exporter 原生反对也行将上线。

ECS 利用场景下,自建 Prometheus 与阿里云 Prometheus 比照

如何应用阿里云 Prometheus 观测 ECS 利用

步骤 1:创立 VPC 实例

登录 Prometheus 控制台 [ 3],抉择新建 Prometheus 实例,依据界面提醒,填写实例名、抉择 VPC / VSwitch / SecurityGroup / Grafana 工作区,即可创立 VPC 实例胜利。操作阐明详见阿里云帮忙核心文档 [ 4]

步骤 2:接入组件监控

目前阿里云 Prometheus 已反对 Node exporter、MySQL、Redis、ElasticSearch、Kafka、Nginx、MongoDB、PostgreSQL、RabbitMQ、RocketMQ、BlackBox 等组件观测。

阿里云 Prometheus 人造内置反对了 static_configs 和 aliyun_sd_configs 两种最罕用 / 实用的服务发现形式,不便用户进行组件观测指标 ECS 的配置。

此处以 MySQL 为例,简要形容接入配置办法。登录 Prometheus 控制台后,进入已创立的 VPC 实例详情的集成核心界面,新建 MySQL 接入,填写 MySQL 监控名称、MySQL 地址、端口、用户名 / 明码等信息即可。具体操作步骤和阐明,参见阿里云帮忙核心文档 [ 5]

步骤 3:查看大盘

阿里云 Prometheus 无缝集成了共享版 Grafana 和专家版 Grafana,用户无需独自装置 Grafana,即可查看各个组件的观测大盘。

接入须要监控的组件后,在集成核心点击对应组件图标的已装置 Exporter,能够看到该组件的大盘略缩图和链接,点击即可进入阿里云 Grafana,查看对应观测大盘。详见阿里云帮忙核心文档 [ 6]

步骤 4:配置告警

进入 VPC 实例详情的集成核心界面,进入 MySQL 组件的告警界面,即可创立 Prometheus 告警规定,详见阿里云帮忙核心文档 [ 7]

阿里云 Prometheus 提供了免运维、开箱即用的 VPC(以及和 VPC 买通的线下 IDC 机房)内 ECS 的 OS、常见中间件、业务利用的 metric 观测能力,实现了一站式的云原生和非云原生环境的 metric 观测协同和闭环。同时咱们正在继续降级和丰盛罕用组件的观测能力(如 Windows、JMX、ClickHouse、Jenkins、Process 等),敬请期待。

对于阿里云 Prometheus 监控

阿里云 Prometheus 服务是基于云原生可观测事实标准 – Prometheus 开源我的项目构建的全托管观测服务。默认集成常见云服务,兼容支流开源组件,全面笼罩业务观测 / 应用层观测 /˙中间件观测 / 零碎层观测。通过开箱即用的 Grafana 看板与智能告警性能,并全面优化探针性能与零碎可用性,帮忙企业疾速搭建一站式指标可观测体系。助业务疾速发现和定位问题,加重故障给业务带来的影响,并免去零碎搭建与日常保护工作量,无效晋升运维观测效率。

与此同时,阿里云 Prometheus 作为阿里云可观测套件的重要组成部分,与 Grafana 服务、链路追踪服务,造成指标存储剖析、链路存储剖析、异构构数据源集成的可观测数据层,同时通过规范的 PromQL 和 SQL,提供数据大盘展现,告警和数据摸索能力。为 IT 老本治理、企业危险治理、智能运维、业务连续性保障等不同场景赋予数据价值,让可观测数据真正做到不止于观测。

更具性价比的计费抉择,Prometheus 包年包月

相干链接

[1] 阿里云 Prometheus 监控

https://help.aliyun.com/docum…

*[2] 常见组件 *

https://help.aliyun.com/docum…

*[3] 利用实时监控服务 ARMS*

https://arms.console.aliyun.c…

[4] Prometheus 实例 for ECS

https://help.aliyun.com/document_detail/274450.html

[5] 应用阿里云 Prometheus 监控 MySQL

https://help.aliyun.com/document_detail/161838.html

[6] 集成核心

https://help.aliyun.com/document_detail/427600.html

[7] Prometheus 告警规定

https://help.aliyun.com/document_detail/331981.html

正文完
 0