WGCLOUD监控平台在运行中,发现主机下线了,查看agent日志,发现以下谬误日志:
[wgcloud-agent]2022/07/01 00:12:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:13:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:14:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:15:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:16:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:17:20 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36[wgcloud-agent]2022/07/01 00:18:46 WgcloudAgent.go:287: 防篡改校验谬误次数大于10次,不再上报数据: 36
这个问题留神几点:
(1) server和agent的主机零碎时间差不能大于15个小时,若时间差不超过15小时打印【防篡改校验谬误】相似信息,疏忽即可
(2) v3.3.5之前版本,server主机的9997端口(这是守护过程wgcloud-daemon-release的默认端口)要凋谢给agent主机,保障agent主机能够telnet通server的9997端口
v3.3.5或当前版本9997端口曾经不须要凋谢给agent拜访
(3) 若是v3.3.5或之后版本,查看server本机是否能失常拜访http://localhost:9997取得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主机的localhost不能应用,能够在配置文件server/config/application.yml,将配置项daemonUrl: http://localhost:9997 中的localhost改成server主机ip
(4) wgcloud-server-release.jar不要编辑批改,若编辑过,还原回去原始安装包里的wgcloud-server-release.jar即可
(5) server和agent要放弃同一个版本号
(6) server端的守护过程(wgcloud-daemon-release)不要敞开,特地是Windows留神不要敞开守护过程窗口。若是Linux,查看此过程是否存活(ps -ef | grep wgcloud)
还有一种可能是server部署在Windows,不小心左键点击守护过程的窗口,进入编辑模式了,右击复原就好了
如果因为此起因的话,重启server(守护过程会随着server启动)后,1小时内所有agent会陆续复原上线,也能够手动重启agent(立刻上线)
(7) server如果运行在arm、龙芯等零碎,须要将守护过程wgcloud-agent-release替换为对应的版本,点击下载
(8) 如果server长时间没有运行,那么当server重新启动后,agent会在1小时内陆续主动复原上线,不必重启agent。也能够手动重启agent,会立即复原上线