共计 1701 个字符,预计需要花费 5 分钟才能阅读完成。
运维监控工具千千万,仅开源的解决方案就有流量监控(MRTG、Cacti、SmokePing、Graphite 等)和性能告警(Nagios、Zabbix、Zenoss Core、Ganglia、OpenTSDB 等)可供选择。面试装逼系列|这篇文章,让运维监控不再成为你的短板!
并且每种软件都有本人的特点和性能,各自的侧重点和指标不完全相同,在设计理念和实现办法上也大同小异,但都具备独特特色。例如,采集数据、剖析展现、告警以及简略的故障主动解决。最终都能达到对 IT 零碎服务可用性的一个齐全展现。
上面咱们将针对目前行业内罕用的五种监控工具(Cacti、Nagios、Zabbix、Grafana、Prometheus)具体介绍各自的特点。
1、Cacti
Cacti(英文含意为仙人掌)是一套基于 PHP、MySQL、SNMP 和 RRDtool 开发的网络流量监测图形剖析工具。
它通过 snmpget 来获取数据,应用 RRDtool 绘图,但使用者毋庸理解 RRDtool 简单的参数。它提供了十分弱小的数据和用户治理性能,能够指定每一个用户能查看树状构造、主机设施以及任何一张图,还能够与 LDAP 联合进行用户认证,同时也能自定义模板,在历史数据的展现监控方面,其性能相当不错。
Cacti 通过增加模板,使不同设施的监控增加具备可复用性,并且具备可自定义绘图的性能,具备弱小的运算能力(数据的叠加性能)。
2、Nagios
Nagios 是一个企业级的监控零碎,可监控服务的运行状态和网络信息等,并能监督所指定的本地或近程主机参数以及服务,同时提供异样告警告诉性能等。
Nagios 可运行在 Linux 和 UNIX 平台上,同时提供一个可选的基于浏览器的 Web 界面,以不便系统管理人员查看网络状态、各种零碎问题,以及日志等。Nagios 的性能侧重于监控服务的可用性,能及时依据触发条件告警。
目前,Nagios 也霸占了肯定的市场份额,不过从察看来看,Nagios 并没有与时俱进,曾经不能满足于多变的监控需要,架构的扩展性和应用的便捷性有待加强,其高级性能集成在商业版 Nagios XI 中。
- Zabbix
Zabbix 是一个分布式监控零碎,反对多种采集形式和采集客户端,有专用的 Agent(代理),也能够反对 SNMP、IPMI、JMX、Telnet、SSH 等多种协定,它将采集到的数据寄存到数据库,而后对其进行剖析整顿,达到条件触发告警。
Zabbix 领有良好的扩展性,同时它的性能非常丰盛,能够监控 CPU 负荷、内存应用、磁盘应用、网络情况、端口监督、日志监督等。
然而因为耗费资源较多的缘故,如果监控的主机十分多时,可能会呈现监控超时、告警超时等景象。
4、Prometheus
Prometheus 作为一个数据监控解决方案,它由一个大型社区反对,有来自 700 多家公司的 6300 个贡献者,13500 个代码提交和 7200 个拉取申请。
Prometheus 具备以下个性:
- 多维的数据模型(基于工夫序列的 Key、Value 键值对)
- 灵便的查问和聚合语言 PromQL
- 提供本地存储和分布式存储
- 通过基于 HTTP 的 Pull 模型采集工夫序列数据
- 可利用 Pushgateway(Prometheus 的可选中间件)实现 Push 模式
- 可通过动静服务发现或动态配置发现指标机器
- 反对多种图表和数据大盘
5、Grafana
Grafana 是一款采纳 go 语言编写的开源利用,次要用于大规模指标数据的可视化展示。
Grafana 反对许多不同的数据源。每个数据源都有一个特定的查问编辑器, 该编辑器定制的个性和性能是公开的特定数据起源。官网反对以下数据源:Graphite,Elasticsearch,InfluxDB,Prometheus,Cloudwatch,MySQL 和 OpenTSDB 等。
每个数据源的查询语言和能力都是不同的。你能够把来自多个数据源的数据组合到一个仪表板,但每一个面板被绑定到一个特定的数据源, 它就属于一个特定的组织。
最初
每个监控工具的劣势和能力都是不同的。你能够依据理论利用需要,抉择适宜的监控工具。阿里云外部超全 K8s/ECS/RDS/OSS/DevOps/DTS 实战手册,提供下载!