nagios使用nrpe监控磁盘遇到的问题

28次阅读

共计 929 个字符,预计需要花费 3 分钟才能阅读完成。

问题描述

nagios 配合 nrpe 用来监控机器中运行项目的具体情况,还包括磁盘、网络、负载均衡和数据库等具体的使用情况;

我遇到的问题:

  • 使用 docker-compose 替换原来项目,将所有的进程 docker 化;
  • 创建的 docker 镜像和 docker-compose 创建的 containers 都在 /var/lib/docker 目录下;
  • 在使用 docker-compose up 的时候,出现警报 XXXXX(inode=-9999%)/var/lib/docker/containers/mounts=6037182531735MB;4830712380730;5434551428321;0;6038390475913

解决的过程遇到的坑

解决的思路:

  • 首先想的是既然报磁盘没有空间的错误,那就需要看这个目录到底是谁占用了这么多的空间:查看的时候发现,/var/lib/docker/ 目录没有权限,不能查看,所以我一路开权限,然后 chmod,知道看到的结果是征程 很正常
  • 接着因为权限打开,警报消除,但是当我重新 docker-compose up 的时候,加入新的镜像,又出现这个问题;无解
  • 想通过忽略指定的文件,让他消失在我的眼前,于是找到了 -i ·regex·;但是当我修改之后,出现了 Unknown 告警;

无解。。。。。

通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1,看起来也没有问题哦;

  • 是不是 /dev/vda1/ 有问题,于是command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1 -i '/dev/vda1/var/lib/dockder/',但是也不行

最终解决的方法

```command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p / -i '/var/lib/dockder/'```

这个命令 OK,生效了!为什么呢?你可以想一下,我今记录一下我的解决问题的过程。

正文完
 0