关于运维:7k-star-监控系统100国产推荐了解

41次阅读

共计 2889 个字符,预计需要花费 8 分钟才能阅读完成。

前言

IT 的归宿是运维,运维的归宿是监控。天下没有不宕机的零碎,抉择一个好用的、趁手的监控工具,是 IT 人“洁身自好”的必备利器。明天要给大家介绍的是“100% 国产”的开源监控工具夜莺监控(Nightingale)。

  • 夜莺仓库:https://github.com/ccfos/nightingale
  • 夜莺文档:https://n9e.github.io

夜莺监控“系出名门”,最早由滴滴孵化并开源,积淀的是顶级互联网公司的最佳实际,之后则捐献给了中国计算机学会进行托管,社区沉闷,发展势头迅猛。就在刚刚看到的数据,夜莺监控在 GitHub 上超过了 7000 个 star,1200 次 fork,相当于每 6 个 star,就有一次 fork,增长曲线十分衰弱!

大家晓得,开源的监控零碎也不少,目前用的比拟宽泛的是 Zabbix 和 Prometheus。Zabbix 善于设施监控不善于微服务和云原生环境的监控,Prometheus 善于微服务和云原生环境的监控,然而设计上偏工具化,短少权限化治理的 WebUI,不足集群化计划。夜莺恰好就是能把 Zabbix 和 Prometheus 的长处都联合起来的那个监控工具!

夜莺最新公布的版本为 V6,是一个 all-in-one 的、开箱即用的监控零碎,反对多数据源接入,可能同时对指标、日志、分布式链路追踪数据进行监控和剖析。

夜莺监控具备以下 7 大特点:

  1. 架构简洁清晰
  2. 装置部署简略
  3. 反对多数据源
  4. 配套有采集器
  5. 告警配置灵便
  6. 仪表盘好看、性能出众
  7. 适应简单多机房场景

一、架构简洁清晰

夜莺作为一款监控零碎,整体设计上十分凋谢,兼容并包,能够和开源生态上其他软件组合应用,比方采集器能够对接 telegraf、categraf、grafana-agent、datadog-agent、以及各类 exporter;存储能够对接 prometheus、thanos、m3、victoriametrics 等。夜莺的产品架构图如下:

从依赖上看,就只依赖 mysql 和 redis,这俩存储对于技术人员来说,都是十分相熟的。夜莺自身就只有一个二进制 + 配置文件,没有其余依赖,所以装置部署都非常容易。

二、装置部署简略

最简略的部署形式,是应用 docker-compose,找一个洁净的机器环境,而后执行上面的命令即可:

git clone https://github.com/ccfos/nightingale.git
cd nightingale/docker
docker-compose up -d

docker-compose 间接应用 host network,所以没有 bridge,启动之后间接浏览器拜访即可,默认端口是 17000,账号 root,明码是 root.2020

不过,在这里更举荐大家应用二进制形式部署,也是几行命令的事,以 linux x86 环境举例:

# 创立个 n9e 的目录,前面把 n9e 相干的文件解压到这里
mkdir -p /opt/n9e && cd /opt/n9e

# 下载 n9e 公布包,amd64 是 x84 的包,下载站点也提供 arm64 的包,如果须要其余平台的包则要自行编译了
tarball=n9e-v6.1.0-linux-amd64.tar.gz
urlpath=https://download.flashcat.cloud/${tarball}
wget -q $urlpath || exit 1

# 解压缩公布包
tar zxvf ${tarball}

# 解压缩之后,能够看到 n9e.sql 是建表语句,导入数据库
mysql -uroot -p1234 < n9e.sql

# 启动 n9e,先应用 nohup 简略测试,如果须要 systemd 托管,请自行筹备 service 文件
nohup ./n9e &> n9e.log &

# 查看 n9e.log 是否有异样日志,查看端口是否在监听,失常应该监听在 17000
ss -tlnp|grep 17000

三、反对多数据源

夜莺最轻量的用法,相似 grafana,间接接入数据源即可,菜单地位:【系统配置】-【数据源】,目前反对的数据源有:prometheus、victoriametrics、thanos、m3、elasticsearch、loki,后续还会反对更多的数据源。

数据源接入之后,就能够查看这些数据,做可视化剖析,做告警了,夜莺默认提供了一些内置大盘(菜单地位:【仪表盘】-【内置仪表盘】)和内置告警规定(菜单地位:【告警治理】-【内置规定】),导入本人的业务组(是个治理概念,不同的告警规定和仪表盘能够应用不同的业务组分门别类治理 + 管制权限)即可应用。

四、配套有采集器

如果之前没有做过监控数据收集,能够应用夜莺团队提供的采集器 categraf,categraf 是一个独自的开源我的项目,内置了 OS、SNMP、IPMI、MySQL、Redis、MongoDB、Oracle、Kafka、ElasticSearch、cAdvisor 等多种采集插件,我的项目地址:https://github.com/flashcatcloud/categraf。当然,也能够应用其余采集器,比方 telegraf、grafana-agent 等,然而 categraf 的对接最为丝滑。

夜莺反对多种数据接入协定,比方 prometheus remote write、OpenTSDB、Datadog 等,接管到数据之后做对立转换,而后转发给后端时序库,具体转发给哪些时序库是在夜莺的配置文件中配置的。

五、告警配置灵便

夜莺的告警配置比拟灵便,能够用一套规定失效到多个数据源,反对级别克制、失效工夫配置、告警屏蔽、告警订阅、告警自愈等等,告警规定的配置界面如下:

六、仪表盘好看、性能出众

夜莺的仪表盘,全副采纳自研的可视化引擎。展现成果好看、性能出众、功能丰富(尽管还没有 grafana 全面,但根本能够作为 grafana 的国产化对标了)。夜莺的仪表盘反对暗黑主题,一个小样例成果如下:

七、适应简单多机房场景

很多公司都有很多机房,如果网络链路相互之间不太好,此时通常会在不同的机房下沉部署时序库,然而告警规定又想在一个核心治理,夜莺也反对这种部署计划,即:把告警引擎下沉追随时序库部署,告警规定的治理和可视化还是放在核心,架构图如下:

应用国外的开源监控我的项目,最放心的就是没有技术支持,夜莺作为“100% 国产”开源我的项目,有两种技术支持形式,一种是社区反对,一种是商业反对,有估算的能够寻求快猫星云团队的技术支持,响应更加及时。社区技术支持渠道,次要是论坛和 GitHub issue,相干地址如下:

  • 论坛地址:https://answer.flashcat.cloud/
  • 夜莺仓库:https://github.com/ccfos/nightingale
  • 夜莺文档:https://n9e.github.io/

夜莺的企业用户有上千家,比方挪动、联通、电信、米哈游、莉莉丝、途游、悠星、高济、益丰、大参林、方正证券、国泰君安、海底捞、海康、搜狐、新浪等,散布在各行各业。夜莺开源我的项目的背地有商业公司在继续运作反对,而且托管在基金会,倒退具备可持续性,举荐大家在日常工作中应用。

正文完
 0