共计 929 个字符,预计需要花费 3 分钟才能阅读完成。
问题描述
nagios 配合 nrpe 用来监控机器中运行项目的具体情况,还包括磁盘、网络、负载均衡和数据库等具体的使用情况;
我遇到的问题:
- 使用 docker-compose 替换原来项目,将所有的进程 docker 化;
- 创建的 docker 镜像和 docker-compose 创建的 containers 都在 /var/lib/docker 目录下;
- 在使用 docker-compose up 的时候,出现警报
XXXXX(inode=-9999%)/var/lib/docker/containers/mounts=6037182531735MB;4830712380730;5434551428321;0;6038390475913
解决的过程遇到的坑
解决的思路:
- 首先想的是既然报磁盘没有空间的错误,那就需要看这个目录到底是谁占用了这么多的空间:查看的时候发现,/var/lib/docker/ 目录没有权限,不能查看,所以我一路开权限,然后 chmod,知道看到的结果是征程 很正常
- 接着因为权限打开,警报消除,但是当我重新 docker-compose up 的时候,加入新的镜像,又出现这个问题;无解
- 想通过忽略指定的文件,让他消失在我的眼前,于是找到了 -i ·regex·;但是当我修改之后,出现了 Unknown 告警;
无解。。。。。
通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1
,看起来也没有问题哦;
- 是不是 /dev/vda1/ 有问题,于是
command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1 -i '/dev/vda1/var/lib/dockder/'
,但是也不行
最终解决的方法
```command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p / -i '/var/lib/dockder/'```
这个命令 OK,生效了!为什么呢?你可以想一下,我今记录一下我的解决问题的过程。
正文完