关于运维:ConsulManager应用场景2如何优雅的使用Consul管理Blackbox站点监控

28次阅读

共计 1250 个字符,预计需要花费 4 分钟才能阅读完成。

【ConsulManager 介绍】

Consul 字段设计说明

  • 所有数据存在一个名为 blackbox_exporter 的 Services 项中,每个监控指标为一个子 Service。
  • 每个 Service 应用 Meta 的 kv 保留监控指标的属性:modulecompanyprojectenvnameinstance,别离示意:监控类型,公司部门,我的项目,环境,名称,实例 url。
  • 新增监控时,监控类型字段 (module) 和 Blackbox 配置中的 module 必须保持一致。
  • 前 5 个字段合并即为 consul 的 serviceID,作为惟一监控项标识

配置 Prometheus 与 Blackbox

原理:基于 Consul 实现 Prometheus 的主动发现性能配置

  • 把 Consul 每个 service 的 Meta 的 KV 关联到 Prometheus 每个指标的标签。
  • 依据每个指标的标签来对监控指标分类,分组,方便管理保护。

    1. 配置 Blackbox_Exporter
  • 在 Web 页面点击 Blackbox 站点监控 /Blackbox 配置,点击 复制配置
  • 编辑 blackbox_exporter 的blackbox.yml,清空已有的配置,把复制的内容粘贴进去,重启 blackbox_exporter。

    2. 配置 Prometheus
  • 在 Web 页面点击 Blackbox 站点监控 /Prometheus 配置,点击 复制配置
  • 编辑 Prometheus 的prometheus.yml,把复制的内容追加到最初,reload 或重启 Prometheus。

    3. 配置 Prometheus 告警规定
  • 在 Web 页面点击 Blackbox 站点监控 / 告警规定,点击 复制配置
  • 编辑 Prometheus 的rules.yml,把复制的内容追加到最初,reload 或重启 Prometheus。

    4. 查看 Prometheus
  • 在 Prometheus 的 Web 页面中,点击 Status-Targets,能看到新增的 Job 即示意数据同步到 Prometheus。

    5. 导入 Blackbox Exporter Dashboard
  • 反对 Grafana 8,基于 blackbox_exporter 0.19.0 设计
  • 采纳图表 + 曲线图形式展现 TCP,ICMP,HTTPS 的服务状态,各阶段申请延时,HTTPS 证书信息等
  • 优化展现成果,反对监控指标的分组、分类级联展现,多服务同时对比展现。
  • 导入 ID:9965
  • 具体 URL:https://grafana.com/grafana/dashboards/9965

批量导入脚本

在 units 目录下 instance.list 中写入监控指标的信息:JOB 名称,公司 / 部门,我的项目,环境,名称,实例 url,每行一个,空格分隔。

留神:前 5 个字段组合起来必须惟一,作为一个监控项的 ID。即 Consul 的 ServiceID

批改 units 目录下导入脚本中的 consul_token 和 consul_url,保留后执行 input.py,即可导入所有监控指标到 Consul,并合乎 Prometheus 的主动发现配置。

正文完
 0