转自@twt社区【作者】许远
【摘要】本文包含两篇Zabbix利用技能分享:Zabbix 负载判断与调整配置参数;Zabbix_server失常运行,却提醒服务器没有运行的解决办法。
Zabbix负载判断与调整配置参数
目标:
在Zabbix负载时提供排查思路及解决办法(次要解说调整配置参数)
解决负载的形式:
禁用异样监控及应用Zabbix客户端被动形式、调整zabbix配置参数、告警收敛(去除没必要的告警,以及防止告警风暴)、硬件更新
倡议:
不应用zabbix管家清理历史数据与趋势数据,数据量大时,zabbix管家数据清理会间接导致zabbix解体;可应用数据库表分区的形式,把对应的数据分为多个分区一一清理
背景:
随着公司体系加大,应用zabbix监控的机器越来越多,主机局部指标时延越来越大,1mà5mà10m
1、查看zabbix队列,查看是否存在5m以上的队列,查看细节确认哪些主机导致队列,有队列则持续下一步(若无队列,界面操作过慢,能够应用IOSTAT查看数据库IO状况)
2、查看对应的主机,是否监控状态异样,状态失常则持续下一步(如果异样:把主机禁用,过几分钟后查看队列是否隐没)
3、手动在zabbix采集服务器上应用zabbix_get命令获取界面无数据的指标,失常获取则持续下一步(若异样,依据报错进行解决问题)
zabbix_get –s 客户端IP –k 键值
4、目前能够判断,数据是能够失常获取,但通过客户端推送时,数据响应工夫过长(客户端agent可配置超时工夫默认3s,可配置30s,批改后数据仍是后面的状况,则持续下一步),导致界面无奈显示;
在图形性能找到zabbix的本身监控,查看”Zabbix cache usage.% free”
在图形中,咱们能够看到zabbix本身的性能已达到负载,超过预约阈值,咱们能够通过调整zabbix-server配置文件参数,加大zabbix性能
StartPollers=160
StartPollersUnreacheable=80
StartTrappers=20
StartPingers=100
StartDiscoverers=120
Cachesize=1024M
startDBSyncers=16
HistoryCacheSize-1024M
TrendCacheSize=1024M
HIstoryTextCacheSize-512M
重启zabbix-server
5、调整参数后,发下zabbix数据采集恢复正常,队列隐没
Zabbix_server失常运行,却提醒服务器没有运行
Zabbix忽然呈现了:
Zabbix server is not running:the information displayed may not be current
Zabbix 服务器没有运行:显示的信息可能不是以后的
一、SELinux未敞开
selinux肯定要敞开,如果开启selinux,可能zabbix的discovery都不能失常应用
敞开selinux办法:
1、批改/etc/selinux/config文件中的SELINUX=“”值为disable,而后重启。
2、如果不想重启,应用setenforce 0
setenforce 1,selinux为enforcing模式
setenforce 0,selinux为permissive模式
二、zabbix web 目录上面,$ZBX_SERVER 是否为IP,如果是localhost,ping一下localhost是否能解析。如果不能,须要/etc/hosts文件里减少相应的我的项目。
三、查看php的fsockopen模块是否启用。
办法一:
第一步:
php.ini文件中查找
allow_url_fopen = On
使其值为On
第二步:
php.ini文件中查找
extension=php_openssl.dll
如果后面有分号,去掉分号
第三步:
重启web服务器,apache或IIS
办法二:
- vi php.ini
找到 allow_url_fopen 这个参数设置成 On,即
allow_url_fopen = On
- 让你的php反对 opensll扩大。
默认,是没有openssl扩大的,只能从新编译装置。
yum install openssl openssl-devel
cd /usr/local/src/php-5.2.14/ext/openssl
/usr/local/php/bin/phpize
./configure –with-openssl –with-php-config=/usr/local/bin/php-config
make && make install
看提醒,把编译成的openssl.so 拷贝到你在php.ini 中指定的 extension_dir 下
- vi php.ini
退出
extension=openssl.so
- 重启web server
四、监控对象占满了trapper过程导致前端与server无奈通信
“At least one trapper process must be running to display server availability and view queue in the frontend.”——Trapper过程用于接管前端查问server可用性及队列的申请将StartTrappers=20调整到StartTrappers=100,重启zabbix-server。
发表回复