关于java:记录一次使用多线程调用kafka发送消息产生的内存泄漏问题

在布控预警的需要实现里，我须要把长久化在数据库中的布控对象（身份证、姓名、手机号、imsi、faceId等等都可别离作为布控对象）始终往kafka里发送，而后由flink进行生产，把以后的布控对象和存储的用户轨迹记录（有旅客、航班、车辆卡口、人脸等等数据）同时蕴含身份证、姓名等等信息进行比对，如果比对胜利则触发布控预警
最开始我是通过单线程发送，发现发送速度有点慢，这外面我须要把布控对象做一些解决（比方split,flat,fitler）后才发送到kafka，大略30w+的布控对象须要十多分钟那边能力预警到，于是开始进行性能优化，应用并行流进行解决，扭转之后同样30w的数据这次只须要8秒左右就能发送实现，然而跑了一阵之后程序开始呈现报错

Received invalid metadata error in produce request on partition xxxTopic due to org.apache.kafka.common.errors.NetworkException: The server disconnected before a response was received.. Going to request metadata update now

第一眼看到这个错，我认为是kafka或者网络出问题了，也去看了broker的日志，发现是有一些对于以后topic被删除的谬误，然而日志级别只是一个info，我认为是topic呈现谬误，又尝试了应用kakfa的生产命令，发现是可能失常生产的，阐明这个topic和metadata应该是没有问题的。
我也在网上搜寻着，发现很少有这个问题的阐明，然而我发现了一些特色，通过我重启后程序又是能够持续发送的，而且速度还是很快，然而跑了一会儿，开始又有这个报错了，开始是一个报错，其余的都胜利，起初是缓缓的，报错越来越多，胜利的越来越少。接着过了很久居然还产生了nacos的心跳超时导致服务不可用的状况。
我这时想到了之前看过的一些文章，说频繁fullgc可能会导致心跳申请失败的问题，最开始的时候看了cpu使用率，发现十分高，600%左右，我认为是因为我的程序外面因为是有定时工作去循环发送音讯所有有点占用是失常的，没有当回事，起初我用起了arthas和gc命令，先应用dashboard，看了下cpu线程，发现gc线程占用以及那个并行流forkjoinpool的线程占用十分大的cpu利用率，而后full gc次数十分多，又应用

jstat -gcutil $pid 1000

命令进行确认，开始我就发现了old区的占用比十分高，且fullgc的频率十分高，简直是几秒钟就有一次，最重要的是，最开始是能回收一些内存，随着工夫的推移，old区占用比基线始终在增长，最初到了100，在这个过程中我也发现了，呈现报错的频率和old区占用比之间是存在关系的，报错越来越多的时候，old区被占用的越多，fullgc越频繁。
这里我才意识到这是呈现内存透露的问题了吧，可能是我写的代码有点问题，于是我持续开始排查，通过

jmap dump:format=b,file=xx.hprof $pid

而后导出文件到本地，用java visualvm关上（也能够用mat，我这里解析类实例的还报了堆内存不足，要改一下/lib/visualvm/etc/visualvm.conf，把-xms改大点）

关于java:记录一次使用多线程调用kafka发送消息产生的内存泄漏问题

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于java:记录一次使用多线程调用kafka发送消息产生的内存泄漏问题

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复