随着公司规模的扩充,本来的人工运维,曾经扛不住了,几百台服务器、几十个集群、几十个数据库,曾经不是人工能看的过去了,上线 Prometheus+Grafana+AlertManager 计划,能做到定点解决问题,不须要再挨个去看,约了很多工夫。
从产品体验的角度来看,原服务,是客户发现问题咱们去解决问题,这样的用户体验是很差的,然而通过 Prometheus+Blackbox-exporter+AlertManager 计划,咱们能够对代表性接口进行检测,依据接口返回的申请工夫等参数评估,当初服务器的整体状态。
总体来说 Prometheus 能够解决运维层面很多货色,也是 DevOps 必须的一项,倡议大家进行深刻理解,学会怎么变懒。
Prometheus 介绍
Prometheus 是开源系统监控工具包,它会将工夫戳和数据联合为时序数据存储起来,大家联合官网文档进行享受。Prometheus 官网文档
联合 docker 运行
docker run -d -p 9090:9090 --name prometheus prom/prometheus
性能介绍
- 运行实现后,浏览器拜访 127.0.0.1:9090 拜访 Prometheus 的后盾
- Alerts:正告规定
-
Graph:图形界面,输出语法,点击执行,通过图形或输入进行查看
- Status->Runtime&Build Info:蕴含了缓存和编译的详细信息
- Status->Configuration:等同 Prometheus 下的 /etc/prometheus/prometheus.yml 里的内容。
- Status->Rules:告警规定,联合 AlertManager 应用
- Status->Targets:指标,展现你在配置文件中要监控的所有指标
- Status-> 服务发现
留神
1.Prometheus 是时序数据,所以对工夫要求很严格,如果 Prometheus 服务没问题,然而图形死活不出数据,那就要思考所在的服务器工夫是否正确了,Centos 配置工夫办法
yum install -y ntp
ntpdate ntp.api.bz
date