早上收到服务器的磁盘告警,查看发现是es日志比拟多,具体看索引由rocketmq的store日志造成。
排查:
1、因为rocketmq的日志对立收集到elk,不便排查。
首先定位到是es造成磁盘告警,查看es的索引数据,疾速找到具体是哪个索引日志
失常状况下,rocketmq的store索引数据在40M左右。
2、查看rocketmq集群挂载的日志,只有一个slave节点的store日志始终在输入warn日志,如下:
3、因为是从节点,重启对业务不会有影响,先重启试试,后果是么用。网上搜寻一番,https://issues.apache.org/jir...
据说可能是commitlog 数据损坏,那这样没方法了,因为是slave节点能够间接删除commitlog数据,再重启会主动从master同步过去。
store日志恢复正常。